Tại sao Ant Group lại tung mô hình AI nghìn tỷ tham số miễn phí cho cả thế giới dùng?

Trương Quang · 10:05 Hôm qua

AI nghìn tỷ tham số của Ant Group có gì đặc biệt đến mức khiến cả ngành phải chú ý?

Ant Group công ty đứng sau ví điện tử Alipay vừa tung ra một bước đi táo bạo trong cuộc đua trí tuệ nhân tạo: công khai Ling-1T, mô hình ngôn ngữ có tới hàng nghìn tỷ tham số, kèm theo một bộ khung suy luận mới tên dInfer. Nghe thì giống những cuộc đua thông số kỹ thuật quen thuộc, nhưng câu chuyện này thú vị hơn vậy: Ant đang thử một chiến lược “hai mũi giáp công” để định hình lại cách AI suy nghĩ và phản hồi.

Mô hình khuếch tán bước ngoặt rẽ khỏi lối mòn ChatGPT

Ling-1T đạt 70,42% trong kỳ thi toán AIME 2025 của Mỹ vốn là thước đo chuẩn cho năng lực suy luận logic của AI. Điểm thú vị là mô hình này xử lý mỗi câu hỏi bằng hơn 4.000 token đầu ra, tương đương với cách con người suy nghĩ dài dòng trước khi trả lời.

Nhưng điều khiến nhiều chuyên gia để mắt hơn chính là dInfer bộ khung suy luận dành cho mô hình khuếch tán, tức là loại AI tạo câu trả lời song song thay vì từng chữ một như ChatGPT vẫn làm. Nếu cách làm truyền thống giống người nói từng từ theo dòng suy nghĩ, thì mô hình khuếch tán giống như người đã suy nghĩ xong trong đầu rồi mới nói ra trọn vẹn.

Trong thử nghiệm, mô hình khuếch tán LLaDA-MoE của Ant chạy trên dInfer đạt 1.011 token/giây, nhanh gấp hơn 10 lần so với nền tảng của Nvidia và hơn 3 lần Alibaba. Với những công ty phải triển khai AI quy mô lớn, tốc độ như vậy tương đương tiết kiệm hàng nghìn tỷ VNĐ chi phí hạ tầng mỗi năm.

Ant Group không chỉ làm một mô hình họ xây cả một “vương quốc AI”

Thay vì chỉ dồn lực vào một siêu mô hình duy nhất như cách nhiều hãng phương Tây đang làm, Ant chia hệ sinh thái AI của mình thành ba nhánh:

Ling mô hình “không suy nghĩ”, tập trung trả lời nhanh các tác vụ ngôn ngữ cơ bản.
Ring mô hình chuyên lý luận sâu, phiên bản Ring-1T đã ra mắt trước đó.
Ming mô hình đa phương thức, xử lý ảnh, âm thanh, video và văn bản cùng lúc.

Kèm theo đó là AWorld, nền tảng đang phát triển để huấn luyện các AI agent những “trợ lý tự hành” có thể tự hoàn thành nhiệm vụ thay người dùng.

Điều thú vị là tất cả được mở mã nguồn thay vì giữ kín. CTO của Ant nói thẳng: “AGI (trí tuệ nhân tạo tổng quát) phải là tài sản công cộng.”

Đây là “chiến thuật né đòn” của các ông lớn Trung Quốc?

Do bị hạn chế nhập khẩu chip cao cấp từ Mỹ, các công ty Trung Quốc như Ant hay ByteDance đang chọn hướng tối ưu phần mềm và thuật toán thay vì chỉ chạy đua phần cứng. ByteDance cũng vừa công bố mô hình khuếch tán Seed Diffusion Preview, nhanh gấp 5 lần so với các mô hình tự hồi quy tương tự.

Nhưng liệu các mô hình khuếch tán có thực sự thay thế ChatGPT style trong tương lai? Vẫn còn dấu hỏi, vì các doanh nghiệp hiện nay vẫn chuộng mô hình tự hồi quy do ổn định và dễ tích hợp.

Câu hỏi là: Nếu Ant Group thực sự mở mã nguồn và đạt hiệu suất như công bố, liệu đây có thể là “Linux của ngành AI”? Và quan trọng hơn nếu Việt Nam có quyền truy cập miễn phí vào nền tảng như vậy, chúng ta sẽ làm gì với nó?
Nguồn: artificialintelligence

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Tại sao Ant Group lại tung mô hình AI nghìn tỷ tham số miễn phí cho cả thế giới dùng?

Trương Quang

Writer

Trương Quang

Mô hình khuếch tán bước ngoặt rẽ khỏi lối mòn ChatGPT

Ant Group không chỉ làm một mô hình họ xây cả một “vương quốc AI”

Đây là “chiến thuật né đòn” của các ông lớn Trung Quốc?

MSI ra mắt siêu máy tính AI cá nhân EdgeXpert xây dựng trên nền tảng NVIDIA DGX Spark, sẽ về Việt Nam với giá “chỉ” gần 120 triệu đồng

Điều gì đang diễn ra bên trong chương trình kiểm định AI y tế bí mật nhất tại Anh?

Con gái và con trai của CEO NVIDIA xuất hiện trước công chúng, hổ phụ sinh hổ tử quả là không sai

Điều gì xảy ra nếu con người ngừng suy nghĩ vì đã có AI làm thay?

“Biết dùng AI” không chỉ là biết gõ prompt !

California ban hành luật mới để bảo vệ trẻ em khỏi rủi ro từ chatbot AI

Cảnh báo khẩn: Chiến dịch giả mạo LastPass đang lan rộng, người dùng có thể mất dữ liệu chỉ sau một cú nhấp chuột

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Chen Zhi là ai?

Chính trị trong Tam Quốc: Mối liên hệ ngầm giữa Trương Phi và Tào Tháo

MSI ra mắt siêu máy tính AI cá nhân EdgeXpert xây dựng trên nền tảng NVIDIA DGX Spark, sẽ về Việt Nam với giá “chỉ” gần 120 triệu đồng

Suzuki Việt Nam chính thức ra mắt All-new Suzuki Fronx: giá từ 520 triệu đồng, kỷ niệm hành trình 30 năm tại Việt Nam

Đánh giá nổi bật

Chủ đề hot

Có thể bạn quan tâm

Tại sao Ant Group lại tung mô hình AI nghìn tỷ tham số miễn phí cho cả thế giới dùng?

Writer

Mô hình khuếch tán bước ngoặt rẽ khỏi lối mòn ChatGPT​

Ant Group không chỉ làm một mô hình họ xây cả một “vương quốc AI”​

Đây là “chiến thuật né đòn” của các ông lớn Trung Quốc?​

MSI ra mắt siêu máy tính AI cá nhân EdgeXpert xây dựng trên nền tảng NVIDIA DGX Spark, sẽ về Việt Nam với giá “chỉ” gần 120 triệu đồng

Điều gì đang diễn ra bên trong chương trình kiểm định AI y tế bí mật nhất tại Anh?

Con gái và con trai của CEO NVIDIA xuất hiện trước công chúng, hổ phụ sinh hổ tử quả là không sai

Điều gì xảy ra nếu con người ngừng suy nghĩ vì đã có AI làm thay?

“Biết dùng AI” không chỉ là biết gõ prompt !

California ban hành luật mới để bảo vệ trẻ em khỏi rủi ro từ chatbot AI

Mô hình khuếch tán bước ngoặt rẽ khỏi lối mòn ChatGPT

Ant Group không chỉ làm một mô hình họ xây cả một “vương quốc AI”

Đây là “chiến thuật né đòn” của các ông lớn Trung Quốc?