Sự phụ thuộc vào NVIDIA và CUDA: "Gót chân Achilles" của AI Trung Quốc lộ rõ

Dũng Đỗ
Dũng Đỗ
Phản hồi: 0
DeepSeek, công ty AI Trung Quốc từng được ca ngợi vì khả năng tạo ra các mô hình AI mạnh mẽ với chi phí thấp, được cho là đang phải hoãn việc ra mắt mô hình thế hệ tiếp theo R2. Nguyên nhân sâu xa được tiết lộ là do tình trạng thiếu hụt chip H20 của NVIDIA, một đòn giáng mạnh vào tham vọng và phơi bày sự phụ thuộc nghiêm trọng của ngành AI Trung Quốc vào công nghệ Mỹ.

Từ kỳ vọng đột phá đến thực tế phũ phàng


Đầu năm nay, mô hình R1 của DeepSeek đã gây ấn tượng mạnh mẽ và được các công ty cũng như tổ chức tại Trung Quốc nhanh chóng áp dụng. Thành công này từng được xem là minh chứng cho thấy các công ty Trung Quốc có thể tạo ra AI chất lượng cao mà không cần đến những con chip đắt đỏ nhất của phương Tây. Tuy nhiên, theo tiết lộ mới nhất từ tờ The Information, thực tế lại không hề đơn giản.

Mô hình R2 thế hệ tiếp theo đang bị trì hoãn và CEO Liang Wenfeng vẫn chưa hài lòng với hiệu năng hiện tại của nó. Nguyên nhân chính được cho là do sự thiếu hụt chip NVIDIA H20. Điều trớ trêu là chính sự thành công của R1 đã góp phần tạo ra vấn đề này. Phần lớn các tổ chức đang vận hành mô hình R1 đều sử dụng chip H20. Giờ đây, khi nguồn cung H20 bị hạn chế, nó không chỉ ảnh hưởng đến việc sử dụng R1 hiện tại mà còn gây khó khăn cho việc chuẩn bị ra mắt R2.

1751334673865.jpeg

Sự phụ thuộc "chí mạng" vào hệ sinh thái NVIDIA


Vấn đề cốt lõi không chỉ nằm ở phần cứng. Mặc dù H20 là phiên bản bị cắt giảm hiệu năng của GPU H100 phổ biến, nó vẫn rất được ưa chuộng tại Trung Quốc. Lý do là vì sự phụ thuộc sâu sắc của các công ty AI Trung Quốc vào hệ sinh thái phần mềm CUDA của NVIDIA. Phần mềm AI của DeepSeek được báo cáo là đã được tối ưu hóa cho phần cứng của NVIDIA, khiến công ty này trở nên đặc biệt dễ bị tổn thương trước các lệnh cấm vận.

Điều này cho thấy vấn đề không chỉ là tìm một con chip thay thế, mà là phải tìm một giải pháp toàn diện bao gồm cả phần cứng và phần mềm tương thích – một thách thức cực kỳ lớn. Ngay cả khi đã dùng một cụm 50.000 GPU để huấn luyện R1, sự phụ thuộc vào hệ sinh thái này vẫn là một điểm yếu chí mạng.

Tác động thực tế của các lệnh trừng phạt


Sự trì hoãn của mô hình R2 là một minh chứng rõ ràng cho tác động thực tế của các biện pháp hạn chế xuất khẩu mà Washington đã áp đặt từ giữa tháng 4 nhằm làm chậm sự phát triển AI của Trung Quốc. Đối với DeepSeek, một công ty từng được xem là niềm hy vọng về khả năng tự chủ công nghệ, việc thiếu hụt nguồn cung phần cứng thiết yếu đang tạo ra những thách thức nghiêm trọng cho các kế hoạch tương lai.

Hiện tại, DeepSeek vẫn chưa đưa ra lịch trình cụ thể cho việc ra mắt R2. Tình trạng này có thể sẽ còn kéo dài, tùy thuộc vào diễn biến của các lệnh hạn chế xuất khẩu và khả năng của các công ty Trung Quốc trong việc tìm kiếm hoặc tự phát triển các giải pháp thay thế hiệu quả cho cả hệ sinh thái phần cứng và phần mềm của NVIDIA.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9zdS1waHUtdGh1b2MtdmFvLW52aWRpYS12YS1jdWRhLWdvdC1jaGFuLWFjaGlsbGVzLWN1YS1haS10cnVuZy1xdW9jLWxvLXJvLjY0MDE0Lw==
Top