Chiêm ngưỡng "bom tấn hạt nhân sức mạnh tính toán" của Huawei ngang ngửa một chiếc container, NVIDIA chỉ là cái tên

Linh Pham
Linh Pham
Phản hồi: 0

Linh Pham

Intern Writer
Ngày 26 tháng 7, tại Hội nghị Trí tuệ Nhân tạo Thế giới (WAIC 2025) rằng Huawei đã lần đầu tiên trưng bày siêu máy tính thực tế Ascend 384, được mệnh danh là "Kho báu WAIC". Tại gian hàng, Huawei cũng trình diễn đầy đủ khả năng đổi mới của nền tảng sức mạnh tính toán Ascend, các giải pháp đào tạo và lập luận, hệ sinh thái phần mềm và phần cứng nguồn mở, cùng các ứng dụng phong phú trong hàng ngàn ngành công nghiệp như Internet, nhà mạng, tài chính, năng lượng, giáo dục và nghiên cứu khoa học.

1753587836652.png


Ưu điểm vượt trội​

Hiện nay, nhu cầu về sức mạnh tính toán cho việc huấn luyện và suy luận mô hình quy mô lớn đã bùng nổ, nhưng kiến trúc điện toán truyền thống đang phải đối mặt với những thách thức như mức sử dụng tài nguyên thấp và thường xuyên gặp sự cố, khiến việc hỗ trợ bước nhảy vọt về công nghệ AI trở nên khó khăn. Điều này đặt ra yêu cầu cao hơn về năng lực kỹ thuật hệ thống của các cụm điện toán.

Vào tháng 5 năm nay, tại Hội nghị Nhà phát triển Ascend Kunpeng, Huawei đã ra mắt siêu nút Ascend 384, bao gồm 12 tủ máy tính và 4 tủ bus. "Quả bom hạt nhân sức mạnh tính toán" khổng lồ này đã đạt được thành công kết nối bus tốc độ cao quy mô lớn nhất trong ngành với 384 card NPU. Theo giới thiệu tại chỗ, siêu nút Ascend có ba ưu điểm: băng thông cực lớn, độ trễ cực thấp và hiệu suất siêu việt, bao gồm nhiều sản phẩm đào tạo và suy luận.

Vượt mặt NVIDIA​

So với các giải pháp siêu nút công nghiệp như NVL72 của NVIDIA, cải tiến quan trọng nhất của siêu nút Ascend là nó phá vỡ hoàn toàn kiến trúc von Neumann truyền thống lấy CPU làm trung tâm, cụ thể là "kiến trúc chủ-tớ", và đề xuất một cách sáng tạo "kiến trúc ngang hàng hoàn chỉnh". Dựa trên đột phá then chốt của bus kết nối tốc độ cao, bus được mở rộng từ bên trong máy chủ đến toàn bộ tủ máy hoặc thậm chí xuyên suốt các tủ máy, và cuối cùng, tất cả các tài nguyên như CPU, NPU, DPU, bộ nhớ lưu trữ và bộ nhớ được kết nối và gộp lại, do đó loại bỏ nhiều liên kết trung chuyển, đạt được kết nối điểm-điểm thực sự, và do đó đạt được mật độ năng lực tính toán và băng thông kết nối lớn hơn.

Xét về thị trường nội địa, chỉ có Huawei mới có thể sử dụng chip sản xuất trong nước để xây dựng siêu node, vượt trội hơn NVIDIA NVL72 về mọi mặt. Ascend 384 siêu node được kết nối hoàn toàn thông qua mạng tốc độ cao MatrixLink mới, tạo thành một siêu "máy chủ AI". Tổng sức mạnh tính toán của nó đạt 300Pflop, gấp 1,7 lần NVIDIA NVL72; tổng băng thông kết nối mạng đạt 269TB/giây, cao hơn 107% so với NVIDIA NVL72; tổng băng thông bộ nhớ đạt 1229TB/giây, cao hơn 113% so với NVIDIA NVL72; thông lượng suy luận của một card đạt 2300 Token/giây.

Quan trọng hơn, thông qua mạng lưới cân bằng tải tối ưu và các giải pháp khác, Ascend Super Node có thể được mở rộng hơn nữa thành cụm siêu nút Atlas 900 SuperCluster chứa hàng chục nghìn thẻ, có thể hỗ trợ quá trình phát triển mô hình quy mô lớn hơn trong tương lai.

Dữ liệu kiểm tra hiệu suất cho thấy trên các cụm siêu nút Ascend, hiệu suất của 100 tỷ mô hình dày đặc như LLaMA3 cao hơn 2,5 lần so với các cụm truyền thống; trên Qwen và DeepSeek, có yêu cầu giao tiếp cao hơn, hiệu suất cải thiện trên các mô hình đa phương thức và MoE có thể đạt hơn 3 lần, cao hơn 1,2 lần so với các cụm khác trong ngành và đang ở vị trí dẫn đầu trong ngành.

Quy trình chip đơn đã tăng từ 7 nanomet lên 5 nanomet, 3 nanomet và 2 nanomet, với hiệu suất cải thiện không quá 20% ở mỗi thế hệ, và mức cải thiện tổng thể đạt khoảng 50%. Huawei đã cải thiện khả năng sử dụng sức mạnh tính toán của chip thông qua hệ thống siêu nút hiệu quả. Không cần thay đổi phần cứng, những thiếu sót của quy trình chip đã được bù đắp ở một mức độ nhất định thông qua việc tối ưu hóa kỹ thuật hệ thống và lập lịch tài nguyên hiệu quả.

1753588004968.png

Kiến trúc nút Ascend 384

Từ 2019, Ascend không chỉ tham gia sâu rộng vào lĩnh vực công nghệ gốc như chip mà còn tiếp tục mở rộng hệ sinh thái ngành, cung cấp phần mềm, công cụ và nền tảng dễ sử dụng để tích hợp sâu công nghệ AI và các kịch bản ngành. Hiện tại, ngành đã điều chỉnh và phát triển hơn 80 mô hình lớn dựa trên Ascend, đồng thời tích lũy nhiều hướng kỹ thuật trong các mô hình lớn cơ bản, chẳng hạn như iFlytek Spark Cognition, DeepSeek, Qwen, Pengcheng, LLaMA, v.v. Đồng thời, Ascend đã hợp tác với hơn 2.700 đối tác trong ngành để cùng nhau ươm tạo hơn 6.000 giải pháp ngành, cho phép hàng trăm mô hình và hàng nghìn hình thức thúc đẩy trí tuệ nhân tạo của ngành.

Gian hàng của Huawei tại WAIC có diện tích hơn 800 mét vuông. Ngoài việc giới thiệu năng lực phần mềm và phần cứng, các giải pháp đào tạo và suy luận, cũng như hệ sinh thái phần mềm và phần cứng nguồn mở của Ascend, gian hàng còn hợp tác với các đối tác để giới thiệu 11 giải pháp công nghiệp chủ chốt, bao gồm Internet, nhà mạng, tài chính, chính phủ, y tế, dầu khí và giao thông vận tải, để khách tham quan có thể đến tham quan và trao đổi trực tiếp.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9jaGllbS1uZ3VvbmctYm9tLXRhbi1oYXQtbmhhbi1zdWMtbWFuaC10aW5oLXRvYW4tY3VhLWh1YXdlaS1uZ2FuZy1uZ3VhLW1vdC1jaGllYy1jb250YWluZXItbnZpZGlhLWNoaS1sYS1jYWktdGVuLjY1OTAwLw==
Top