Trương Quang
Writer
AI nghìn tỷ tham số của Ant Group có gì đặc biệt đến mức khiến cả ngành phải chú ý?
Ant Group công ty đứng sau ví điện tử Alipay vừa tung ra một bước đi táo bạo trong cuộc đua trí tuệ nhân tạo: công khai Ling-1T, mô hình ngôn ngữ có tới hàng nghìn tỷ tham số, kèm theo một bộ khung suy luận mới tên dInfer. Nghe thì giống những cuộc đua thông số kỹ thuật quen thuộc, nhưng câu chuyện này thú vị hơn vậy: Ant đang thử một chiến lược “hai mũi giáp công” để định hình lại cách AI suy nghĩ và phản hồi.
Nhưng điều khiến nhiều chuyên gia để mắt hơn chính là dInfer bộ khung suy luận dành cho mô hình khuếch tán, tức là loại AI tạo câu trả lời song song thay vì từng chữ một như ChatGPT vẫn làm. Nếu cách làm truyền thống giống người nói từng từ theo dòng suy nghĩ, thì mô hình khuếch tán giống như người đã suy nghĩ xong trong đầu rồi mới nói ra trọn vẹn.
Trong thử nghiệm, mô hình khuếch tán LLaDA-MoE của Ant chạy trên dInfer đạt 1.011 token/giây, nhanh gấp hơn 10 lần so với nền tảng của Nvidia và hơn 3 lần Alibaba. Với những công ty phải triển khai AI quy mô lớn, tốc độ như vậy tương đương tiết kiệm hàng nghìn tỷ VNĐ chi phí hạ tầng mỗi năm.
Điều thú vị là tất cả được mở mã nguồn thay vì giữ kín. CTO của Ant nói thẳng: “AGI (trí tuệ nhân tạo tổng quát) phải là tài sản công cộng.”
Nhưng liệu các mô hình khuếch tán có thực sự thay thế ChatGPT style trong tương lai? Vẫn còn dấu hỏi, vì các doanh nghiệp hiện nay vẫn chuộng mô hình tự hồi quy do ổn định và dễ tích hợp.
Câu hỏi là: Nếu Ant Group thực sự mở mã nguồn và đạt hiệu suất như công bố, liệu đây có thể là “Linux của ngành AI”? Và quan trọng hơn nếu Việt Nam có quyền truy cập miễn phí vào nền tảng như vậy, chúng ta sẽ làm gì với nó?
Nguồn: artificialintelligence

Ant Group công ty đứng sau ví điện tử Alipay vừa tung ra một bước đi táo bạo trong cuộc đua trí tuệ nhân tạo: công khai Ling-1T, mô hình ngôn ngữ có tới hàng nghìn tỷ tham số, kèm theo một bộ khung suy luận mới tên dInfer. Nghe thì giống những cuộc đua thông số kỹ thuật quen thuộc, nhưng câu chuyện này thú vị hơn vậy: Ant đang thử một chiến lược “hai mũi giáp công” để định hình lại cách AI suy nghĩ và phản hồi.
Mô hình khuếch tán bước ngoặt rẽ khỏi lối mòn ChatGPT
Ling-1T đạt 70,42% trong kỳ thi toán AIME 2025 của Mỹ vốn là thước đo chuẩn cho năng lực suy luận logic của AI. Điểm thú vị là mô hình này xử lý mỗi câu hỏi bằng hơn 4.000 token đầu ra, tương đương với cách con người suy nghĩ dài dòng trước khi trả lời.Nhưng điều khiến nhiều chuyên gia để mắt hơn chính là dInfer bộ khung suy luận dành cho mô hình khuếch tán, tức là loại AI tạo câu trả lời song song thay vì từng chữ một như ChatGPT vẫn làm. Nếu cách làm truyền thống giống người nói từng từ theo dòng suy nghĩ, thì mô hình khuếch tán giống như người đã suy nghĩ xong trong đầu rồi mới nói ra trọn vẹn.
Trong thử nghiệm, mô hình khuếch tán LLaDA-MoE của Ant chạy trên dInfer đạt 1.011 token/giây, nhanh gấp hơn 10 lần so với nền tảng của Nvidia và hơn 3 lần Alibaba. Với những công ty phải triển khai AI quy mô lớn, tốc độ như vậy tương đương tiết kiệm hàng nghìn tỷ VNĐ chi phí hạ tầng mỗi năm.
Ant Group không chỉ làm một mô hình họ xây cả một “vương quốc AI”
Thay vì chỉ dồn lực vào một siêu mô hình duy nhất như cách nhiều hãng phương Tây đang làm, Ant chia hệ sinh thái AI của mình thành ba nhánh:- Ling mô hình “không suy nghĩ”, tập trung trả lời nhanh các tác vụ ngôn ngữ cơ bản.
- Ring mô hình chuyên lý luận sâu, phiên bản Ring-1T đã ra mắt trước đó.
- Ming mô hình đa phương thức, xử lý ảnh, âm thanh, video và văn bản cùng lúc.
Điều thú vị là tất cả được mở mã nguồn thay vì giữ kín. CTO của Ant nói thẳng: “AGI (trí tuệ nhân tạo tổng quát) phải là tài sản công cộng.”
Đây là “chiến thuật né đòn” của các ông lớn Trung Quốc?
Do bị hạn chế nhập khẩu chip cao cấp từ Mỹ, các công ty Trung Quốc như Ant hay ByteDance đang chọn hướng tối ưu phần mềm và thuật toán thay vì chỉ chạy đua phần cứng. ByteDance cũng vừa công bố mô hình khuếch tán Seed Diffusion Preview, nhanh gấp 5 lần so với các mô hình tự hồi quy tương tự.Nhưng liệu các mô hình khuếch tán có thực sự thay thế ChatGPT style trong tương lai? Vẫn còn dấu hỏi, vì các doanh nghiệp hiện nay vẫn chuộng mô hình tự hồi quy do ổn định và dễ tích hợp.
Câu hỏi là: Nếu Ant Group thực sự mở mã nguồn và đạt hiệu suất như công bố, liệu đây có thể là “Linux của ngành AI”? Và quan trọng hơn nếu Việt Nam có quyền truy cập miễn phí vào nền tảng như vậy, chúng ta sẽ làm gì với nó?
Nguồn: artificialintelligence