Hoàng Đức
Writer
Bài viết của Hu Yanping, Giáo sư danh dự Đại học Tài chính và Kinh tế Thượng Hải bày tỏ lo ngại DeepSeek biến mất quá lâu rồi. Trong khi cả ngành AI chạy như vũ bão qua bốn làn sóng lớn, DeepSeek gần như đứng ngoài nhìn. Anthropic, Google, ByteDance, Kimi đều đã chiếm chỗ ở những thị trường mà lẽ ra DeepSeek có thể chen vào.
Nội dung bức thư lược dịch như sau:
Hơn một năm trước, DeepSeek R1 ra đời và làm chấn động thế giới công nghệ. Chi phí thấp, hiệu năng cao, mã nguồn mở, nó không chỉ dẫn đầu trong nước mà còn được cả thế giới đón nhận. Ngay cả những người lớn tuổi ngoài phố cũng nói về trợ lý AI do Trung Quốc tự phát triển này. Nhưng kể từ đó, DeepSeek gần như im lặng.
Tôi viết bức thư này không phải để chỉ trích, mà vì tôi tin rằng DeepSeek vẫn còn nợ thế giới một câu trả lời. Và đây có thể là lần cuối cùng tôi kêu gọi họ cập nhật.
Thế giới AI đã thay đổi, DeepSeek chưa theo kịp
Trong năm DeepSeek vắng mặt, ngành công nghiệp AI đã trải qua bốn làn sóng lớn: lập trình AI, đa phương thức, tác nhân thông minh và hệ điều hành AI kiểu "thâu tóm" như OpenClaw hay Claude Code.
Ở mỗi làn sóng đó, DeepSeek đều vắng mặt hoặc đứng ngoài rìa. Lập trình AI bị Anthropic và Kimi nắm giữ. Đa phương thức bị Gemini và Seedance của ByteDance dẫn dắt. Tác nhân thông minh thì Manus và Kimi Agent Swarm đang bứt phá. Còn hệ điều hành AI, Claude Code đã cắt đứt đường tiến của nhiều đối thủ trước khi họ kịp phản ứng.
Trong khi đó, "đoàn quân Trung Quốc" đã lớn mạnh thành một tập đoàn cạnh tranh thực sự, gồm bốn ông lớn ByteDance, Alibaba, Tencent, Baidu và sáu công ty nổi bật như Kimi, MiniMax, Zhipu. Câu chuyện AI của Trung Quốc không còn xoay quanh một mình DeepSeek nữa.
Vì sao mọi người vẫn nhớ DeepSeek?
Câu trả lời đơn giản: vì token ngày càng đắt. Các ứng dụng tác nhân thông minh đang tiêu thụ token như "tôm càng ăn thức ăn", đẩy chi phí người dùng lên cao. DeepSeek từng là người mang lại token rẻ hơn cho toàn ngành, và ngành đang cần điều đó một lần nữa.
Lượng token tiêu thụ hàng ngày tại Trung Quốc đã tăng từ 100 tỷ đầu năm 2024 lên 140 nghìn tỷ vào tháng 3 năm 2026, tức là tăng hơn một nghìn lần chỉ trong hai năm. Token đang trở thành đơn vị đo lường của nền kinh tế thông minh, giống như kilowatt-giờ trong kỷ nguyên công nghiệp. Ai kiểm soát được chi phí token, người đó nắm lợi thế cạnh tranh.
DeepSeek hiểu điều này hơn ai hết. Và chính vì vậy, sự vắng mặt của họ là một khoảng trống thực sự.
Những dấu hiệu cho thấy V4 đang đến gần
Không phải DeepSeek hoàn toàn im lặng. Kể từ tháng 10 năm ngoái, họ đã đẩy mạnh công bố các bài báo khoa học về kiến trúc mô hình, trong đó ba công trình nổi bật là mHC, Engram và DualPath.
mHC giải quyết vấn đề bùng nổ tín hiệu khi huấn luyện mô hình hàng nghìn tỷ tham số, mở đường cho việc xây dựng các mô hình khổng lồ mà không cần phụ thuộc vào chip tiên tiến của Mỹ. Engram tạo ra cơ chế bộ nhớ liên phiên, giúp mô hình nhớ được ngữ cảnh dài mà không tiêu tốn quá nhiều năng lực tính toán. DualPath cải thiện hiệu suất suy luận gần gấp đôi chỉ thông qua tối ưu hóa phần mềm thuần túy, không cần phần cứng mạnh hơn
Tất cả những dấu hiệu này, cộng với thông tin cho rằng DeepSeek đang ưu tiên cho các nhà cung cấp chip Trung Quốc như Huawei tiếp cận V4 trước Nvidia và AMD, cho thấy một điều: họ đang chuẩn bị cho điều gì đó lớn hơn, không chỉ là một bản cập nhật thông thường.
Kỳ vọng của tôi với V4
Tôi không muốn một mô hình ngôn ngữ mạnh hơn một chút. Tôi muốn một nền tảng tác nhân thông minh thực sự, có khả năng tự động thực hiện các tác vụ phức tạp, tích hợp đa công cụ và tương tác hiệu quả với môi trường bên ngoài.
Cụ thể hơn, V4 cần cửa sổ ngữ cảnh một triệu token hoạt động thực sự, không chỉ thử nghiệm thang độ xám. Nó cần khả năng đa phương thức gốc, không phải xử lý hậu kỳ. Nó cần hỗ trợ mạnh mẽ cho các tác nhân, công cụ và mã nguồn. Và quan trọng nhất, nó cần chạy hiệu quả trên chip Trung Quốc để chứng minh rằng chuỗi công nghiệp AI trong nước đã hoàn chỉnh thực sự.
Nếu DeepSeek V4 đạt hiệu năng đẳng cấp thế giới khi chạy trên chip Huawei với chi phí thấp hơn, đó sẽ là cú đánh thứ hai vào Nvidia, sau khi R1 từng xóa bay 589 tỷ đô la vốn hóa của họ chỉ trong một đêm.
Bức thư cuối
Năm 2026 là năm của những bước nhảy vọt. OpenAI, Anthropic, Google đều đang tung át chủ bài. Cuộc cạnh tranh đã chuyển từ mô hình đơn lẻ sang toàn bộ hệ sinh thái, từ đột phá kỹ thuật sang thống trị thị trường.
Hệ sinh thái mã nguồn mở cần động lực từ DeepSeek. Nền kinh tế token cần hiệu quả chi phí mà DeepSeek từng mang lại. Năng lực tính toán trong nước của Trung Quốc cần DeepSeek V4 để chứng minh mình xứng tầm. Và "đoàn quân Trung Quốc" cần DeepSeek trở lại để câu chuyện AI của Trung Quốc không chỉ là câu chuyện của những người theo sau.
Khoảng cách giữa mô hình Trung Quốc và Mỹ trong các tác vụ phức tạp vẫn còn đó. DeepSeek là một trong số ít có khả năng thực sự thu hẹp nó.
Tôi hy vọng sự im lặng một năm qua của họ là điềm báo cho một sự bùng nổ mạnh mẽ hơn. Đây là lần cuối tôi kêu gọi. Bây giờ là lúc DeepSeek phải lên tiếng.
Nội dung bức thư lược dịch như sau:
Hơn một năm trước, DeepSeek R1 ra đời và làm chấn động thế giới công nghệ. Chi phí thấp, hiệu năng cao, mã nguồn mở, nó không chỉ dẫn đầu trong nước mà còn được cả thế giới đón nhận. Ngay cả những người lớn tuổi ngoài phố cũng nói về trợ lý AI do Trung Quốc tự phát triển này. Nhưng kể từ đó, DeepSeek gần như im lặng.
Tôi viết bức thư này không phải để chỉ trích, mà vì tôi tin rằng DeepSeek vẫn còn nợ thế giới một câu trả lời. Và đây có thể là lần cuối cùng tôi kêu gọi họ cập nhật.
Thế giới AI đã thay đổi, DeepSeek chưa theo kịp
Trong năm DeepSeek vắng mặt, ngành công nghiệp AI đã trải qua bốn làn sóng lớn: lập trình AI, đa phương thức, tác nhân thông minh và hệ điều hành AI kiểu "thâu tóm" như OpenClaw hay Claude Code.
Ở mỗi làn sóng đó, DeepSeek đều vắng mặt hoặc đứng ngoài rìa. Lập trình AI bị Anthropic và Kimi nắm giữ. Đa phương thức bị Gemini và Seedance của ByteDance dẫn dắt. Tác nhân thông minh thì Manus và Kimi Agent Swarm đang bứt phá. Còn hệ điều hành AI, Claude Code đã cắt đứt đường tiến của nhiều đối thủ trước khi họ kịp phản ứng.
Trong khi đó, "đoàn quân Trung Quốc" đã lớn mạnh thành một tập đoàn cạnh tranh thực sự, gồm bốn ông lớn ByteDance, Alibaba, Tencent, Baidu và sáu công ty nổi bật như Kimi, MiniMax, Zhipu. Câu chuyện AI của Trung Quốc không còn xoay quanh một mình DeepSeek nữa.
Vì sao mọi người vẫn nhớ DeepSeek?
Câu trả lời đơn giản: vì token ngày càng đắt. Các ứng dụng tác nhân thông minh đang tiêu thụ token như "tôm càng ăn thức ăn", đẩy chi phí người dùng lên cao. DeepSeek từng là người mang lại token rẻ hơn cho toàn ngành, và ngành đang cần điều đó một lần nữa.
Lượng token tiêu thụ hàng ngày tại Trung Quốc đã tăng từ 100 tỷ đầu năm 2024 lên 140 nghìn tỷ vào tháng 3 năm 2026, tức là tăng hơn một nghìn lần chỉ trong hai năm. Token đang trở thành đơn vị đo lường của nền kinh tế thông minh, giống như kilowatt-giờ trong kỷ nguyên công nghiệp. Ai kiểm soát được chi phí token, người đó nắm lợi thế cạnh tranh.
DeepSeek hiểu điều này hơn ai hết. Và chính vì vậy, sự vắng mặt của họ là một khoảng trống thực sự.
Những dấu hiệu cho thấy V4 đang đến gần
Không phải DeepSeek hoàn toàn im lặng. Kể từ tháng 10 năm ngoái, họ đã đẩy mạnh công bố các bài báo khoa học về kiến trúc mô hình, trong đó ba công trình nổi bật là mHC, Engram và DualPath.
mHC giải quyết vấn đề bùng nổ tín hiệu khi huấn luyện mô hình hàng nghìn tỷ tham số, mở đường cho việc xây dựng các mô hình khổng lồ mà không cần phụ thuộc vào chip tiên tiến của Mỹ. Engram tạo ra cơ chế bộ nhớ liên phiên, giúp mô hình nhớ được ngữ cảnh dài mà không tiêu tốn quá nhiều năng lực tính toán. DualPath cải thiện hiệu suất suy luận gần gấp đôi chỉ thông qua tối ưu hóa phần mềm thuần túy, không cần phần cứng mạnh hơn
Tất cả những dấu hiệu này, cộng với thông tin cho rằng DeepSeek đang ưu tiên cho các nhà cung cấp chip Trung Quốc như Huawei tiếp cận V4 trước Nvidia và AMD, cho thấy một điều: họ đang chuẩn bị cho điều gì đó lớn hơn, không chỉ là một bản cập nhật thông thường.
Kỳ vọng của tôi với V4
Tôi không muốn một mô hình ngôn ngữ mạnh hơn một chút. Tôi muốn một nền tảng tác nhân thông minh thực sự, có khả năng tự động thực hiện các tác vụ phức tạp, tích hợp đa công cụ và tương tác hiệu quả với môi trường bên ngoài.
Cụ thể hơn, V4 cần cửa sổ ngữ cảnh một triệu token hoạt động thực sự, không chỉ thử nghiệm thang độ xám. Nó cần khả năng đa phương thức gốc, không phải xử lý hậu kỳ. Nó cần hỗ trợ mạnh mẽ cho các tác nhân, công cụ và mã nguồn. Và quan trọng nhất, nó cần chạy hiệu quả trên chip Trung Quốc để chứng minh rằng chuỗi công nghiệp AI trong nước đã hoàn chỉnh thực sự.
Nếu DeepSeek V4 đạt hiệu năng đẳng cấp thế giới khi chạy trên chip Huawei với chi phí thấp hơn, đó sẽ là cú đánh thứ hai vào Nvidia, sau khi R1 từng xóa bay 589 tỷ đô la vốn hóa của họ chỉ trong một đêm.
Bức thư cuối
Năm 2026 là năm của những bước nhảy vọt. OpenAI, Anthropic, Google đều đang tung át chủ bài. Cuộc cạnh tranh đã chuyển từ mô hình đơn lẻ sang toàn bộ hệ sinh thái, từ đột phá kỹ thuật sang thống trị thị trường.
Hệ sinh thái mã nguồn mở cần động lực từ DeepSeek. Nền kinh tế token cần hiệu quả chi phí mà DeepSeek từng mang lại. Năng lực tính toán trong nước của Trung Quốc cần DeepSeek V4 để chứng minh mình xứng tầm. Và "đoàn quân Trung Quốc" cần DeepSeek trở lại để câu chuyện AI của Trung Quốc không chỉ là câu chuyện của những người theo sau.
Khoảng cách giữa mô hình Trung Quốc và Mỹ trong các tác vụ phức tạp vẫn còn đó. DeepSeek là một trong số ít có khả năng thực sự thu hẹp nó.
Tôi hy vọng sự im lặng một năm qua của họ là điềm báo cho một sự bùng nổ mạnh mẽ hơn. Đây là lần cuối tôi kêu gọi. Bây giờ là lúc DeepSeek phải lên tiếng.