Derpy
Intern Writer
CEO Jensen Huang của NVIDIA đã có một bài phát biểu quan trọng trước thềm khai mạc CES 2026. Trong 90 phút đầy ắp thông tin, ông đã vẽ nên một bức tranh tương lai đầy táo bạo và toàn diện cho ngành công nghệ toàn cầu.
Trong bài diễn thuyết này, ông không chỉ tuyên bố rằng trọng tâm phát triển của trí tuệ nhân tạo đang chuyển dịch từ "trí tuệ số" thuần túy sang "AI vật lý" – tức là AI có khả năng tương tác với thế giới thực. Ông còn trình làng hàng loạt công cụ mã nguồn mở cực kỳ mạnh mẽ, từ mô hình thế giới Cosmos, hệ thống lái tự động AlphaMio cho đến kiến trúc chip AI thế hệ mới Vera Rubin.
Tất cả đều thể hiện tham vọng của NVIDIA, một gã khổng lồ công nghệ toàn diện, muốn xây dựng mọi nền tảng cơ bản cho kỷ nguyên mới này, từ chip cấp thấp, hạ tầng cho đến các mô hình và ứng dụng hàng đầu. Khi nhu cầu về sức mạnh tính toán trong thời đại AI đang tăng lên không ngừng, NVIDIA vẫn đang nỗ lực nâng cấp tối đa các nền tảng tính toán của mình, nhằm chiếm lĩnh vị trí nền tảng sức mạnh tính toán khổng lồ của thế giới số.
**DeepSeek và lời nhắc nhở: Mã nguồn mở là động lực chính của đổi mới**
Mở đầu bài phát biểu, ông Huang đã nhìn lại lịch sử và chia sẻ một cách đầy cảm xúc rằng: "Cứ mỗi 10 đến 15 năm, ngành công nghiệp tính toán lại trải qua một cuộc chuyển đổi nền tảng." Ông nhấn mạnh rằng chúng ta hiện đang đồng thời trải qua hai cuộc chuyển đổi lớn. Thứ nhất là các ứng dụng đang chuyển sang xây dựng dựa trên AI làm cốt lõi. Thứ hai là toàn bộ mô hình phát triển và vận hành phần mềm đang được định hình lại, từ "lập trình" sang "huấn luyện", từ CPU sang GPU, và từ việc thực thi mã biên dịch sẵn sang tạo nội dung theo thời gian thực.
"Điều này có nghĩa là ngành công nghiệp tính toán trị giá khoảng 10 nghìn tỷ USD (tương đương khoảng 250 triệu tỷ VNĐ) trong thập kỷ qua đang được hiện đại hóa," ông Huang chỉ ra. Ông cũng cho biết nguồn vốn thúc đẩy cuộc cách mạng này đến từ việc chuyển dịch ngân sách nghiên cứu và phát triển toàn cầu sang AI, cùng với hàng tỷ USD (tương đương hàng chục nghìn tỷ VNĐ) đầu tư mạo hiểm.
Ông đặc biệt dành nhiều thời lượng để ca ngợi vai trò cách mạng của các mô hình mã nguồn mở, và một lần nữa bày tỏ sự kinh ngạc trước DeepSeek, một minh chứng cho thấy mã nguồn mở đang giúp AI lan rộng nhanh chóng, khiến không ai muốn bị bỏ lại phía sau. "Các mô hình mã nguồn mở đã chạm đến ranh giới công nghệ," ông Huang nói. Mặc dù vẫn còn khoảng 6 tháng chênh lệch giữa các mô hình mã nguồn mở hàng đầu và các mô hình độc quyền tiên tiến nhất, nhưng sự lặp lại nhanh chóng này đang kích hoạt sự đổi mới toàn cầu.
"Làm sao chúng ta có thể để bất kỳ ai bị bỏ lại phía sau trong hình thái số của trí tuệ?" ông đặt câu hỏi. Bản thân NVIDIA cũng đã đầu tư hàng tỷ USD (tương đương hàng chục nghìn tỷ VNĐ) vào các cụm siêu máy tính DGX để thúc đẩy phát triển mô hình mã nguồn mở, và đã đạt được những đột phá trong nhiều lĩnh vực khoa học như dự đoán cấu trúc protein (Open Fold Three) và dự báo thời tiết (Forecast Net).
**Tác nhân thông minh và AI vật lý – Từ hiểu ngôn ngữ đến hiểu thế giới**
Ông Huang đã giải thích chi tiết về giai đoạn tiến hóa tiếp theo của khả năng AI: từ "ghi nhớ và tạo sinh" của các mô hình ngôn ngữ lớn sang "suy luận và hành động" của các tác nhân thông minh (Agent). Ông giải thích rằng các mô hình ban đầu thường tạo ra "ảo giác" vì chúng thiếu khả năng "nghiên cứu cơ bản" trước khi đưa ra câu trả lời. Trong khi đó, các khung tác nhân thông minh hiện đại có thể thực hiện suy luận theo chuỗi tư duy, chủ động lập kế hoạch các bước và gọi các công cụ, từ đó giải quyết những vấn đề mới chưa từng được huấn luyện rõ ràng.
"Điều này mở ra cánh cửa cho vô vàn ứng dụng. Chúng ta không còn cần phải huấn luyện AI hiểu mọi thứ ngay từ ngày đầu tiên," ông Huang chia sẻ. Kiến trúc tác nhân thông minh này về bản chất là đa mô hình, đa đám mây và hỗn hợp, có khả năng chọn mô hình tối ưu một cách linh hoạt tùy theo nhiệm vụ, đồng thời kết hợp với các mô hình tùy chỉnh riêng của doanh nghiệp, tạo nên khả năng AI vừa tiên tiến vừa độc quyền.
Tuy nhiên, thách thức thực sự nằm ở việc làm cho AI hiểu thế giới vật lý. "Một đứa trẻ cũng hiểu những kiến thức thông thường như vật thể tồn tại vĩnh viễn, trọng lực, ma sát, nhưng đối với AI thì hoàn toàn xa lạ," ông Huang chỉ ra. Điều này dẫn đến chủ đề cốt lõi của bài phát biểu: AI vật lý. Để đạt được điều này, chúng ta cần xây dựng một hệ thống hoàn chỉnh gồm ba máy tính: một để huấn luyện mô hình AI, một để suy luận theo thời gian thực trên robot hoặc ô tô ("điện toán biên"), và máy thứ ba dùng để mô phỏng vật lý độ chính xác cao, nhằm tạo ra dữ liệu huấn luyện và đánh giá mức độ an toàn của hành vi AI.
**Mô hình thế giới Cosmos và hệ thống lái tự động AlphaMio**
Sau đó, ông Huang đã giới thiệu một cách trang trọng giải pháp cốt lõi của NVIDIA để đối phó với thách thức AI vật lý: NVIDIA Cosmos. Đây là một mô hình nền tảng thế giới mã nguồn mở, "tiên tiến", không dựa trên ngôn ngữ mà dựa trên việc học từ video quy mô internet, dữ liệu lái xe thực tế và mô phỏng 3D, từ đó xây dựng một biểu diễn thống nhất về cách thế giới vận hành. Cosmos có thể tạo ra video chân thực từ một bức ảnh duy nhất, hoặc tạo ra quỹ đạo chuyển động hợp lý về mặt vật lý từ mô tả cảnh 3D. Quan trọng hơn, nó có thể phản ứng với các hành động của AI trong mô phỏng vòng lặp tương tác và thực hiện suy luận nhân quả.
"Cosmos biến tính toán thành dữ liệu," ông Huang nhấn mạnh. Điều này giải quyết được nút thắt cổ chai về chi phí và hiệu quả trong việc thu thập lượng lớn dữ liệu, đặc biệt là dữ liệu kịch bản "đuôi dài" (hiếm gặp) trong thế giới thực.
Dựa trên lượng lớn dữ liệu tổng hợp và dữ liệu thực tế được tạo ra bởi Cosmos, NVIDIA đã huấn luyện và công bố mã nguồn mở hệ thống lái tự động đầu tiên của mình – NVIDIA AlphaMio. Ông Huang tuyên bố đây là "AI lái xe tự động đầu tiên trên thế giới có khả năng suy nghĩ và suy luận." AlphaMio không chỉ xử lý đầu vào từ cảm biến và điều khiển phương tiện, mà còn có thể giải thích cho hành khách về hành động sắp thực hiện và quá trình suy luận đằng sau đó. Khả năng "giải thích" và suy luận để đối phó với các kịch bản không xác định này là chìa khóa để xử lý "vấn đề đuôi dài" trong lái xe tự động. Ông cũng thông báo rằng chiếc xe Mercedes-Benz đầu tiên được trang bị AlphaMio sẽ lăn bánh vào quý 1 năm 2026.
**Nhu cầu tính toán tăng vọt, Vera Rubin ra đời đúng lúc**
Đến nửa sau bài phát biểu, ông Huang cuối cùng đã trình làng "món chính" – kiến trúc chip mới đầy trọng lượng.
Đối mặt với thách thức về quy mô mô hình AI tăng gấp 10 lần mỗi năm và nhu cầu tính toán bùng nổ, ông Huang cho biết họ buộc phải thiết kế lại từng con chip. Ông chính thức tiết lộ kiến trúc chip AI thế hệ tiếp theo của NVIDIA: NVIDIA Vera Rubin. Tên gọi này được đặt theo tên nhà thiên văn học Vera Rubin, người đã khám phá ra vật chất tối, với ý nghĩa soi sáng những lĩnh vực chưa biết của điện toán AI.
"Rubin ra đời đúng lúc, bởi vì nhu cầu tính toán AI cho huấn luyện và suy luận đang tăng vọt," ông Huang chia sẻ. Ông giải thích rằng, trong bối cảnh Định luật Moore đang chậm lại, việc chỉ tăng nhẹ số lượng bóng bán dẫn (số lượng bóng bán dẫn của GPU Rubin chỉ gấp 1.6 lần so với Blackwell) không thể mang lại bước nhảy vọt về hiệu năng. Bí quyết của Vera Rubin nằm ở "thiết kế cộng tác cực đoan" – thiết kế lại hoàn toàn tất cả các chip trong công ty để chúng hoạt động như một hệ thống tổng thể. Ông cũng đồng thời giới thiệu 6 loại chip: Vera CPU, Rubin GPU, NVLink 6 Switch, card mạng thông minh ConnectX-9 (CX9), BlueField-4 DPU, Spectrum-X 102.4T CPO. Ông Huang đánh giá "mỗi con chip đều mang tính cách mạng" và xứng đáng có một buổi ra mắt riêng.
Vera CPU và Rubin GPU: CPU thế hệ mới có tỷ lệ hiệu năng trên điện năng tiêu thụ tăng gấp 2 lần, hiệu năng dấu phẩy động AI của GPU đạt gấp 5 lần so với Blackwell.
Lõi Tensor NVFP4 mang tính cách mạng: Đây là một bộ xử lý chuyên dụng có khả năng tự động điều chỉnh độ chính xác để tối ưu hóa thông lượng của mô hình Transformer. Ông Huang ca ngợi đây là "một công trình đột phá" và gợi ý rằng nó có thể trở thành tiêu chuẩn ngành trong tương lai.
Đổi mới toàn diện: Từ bộ chuyển mạch Ethernet Spectrum-X tích hợp quang tử silicon (với 512 cổng 200 Gb/s), đến BlueField-4 DPU được tái cấu trúc cho khối lượng công việc AI (dùng để quản lý bộ nhớ đệm ngữ cảnh KV đang tăng trưởng bùng nổ), cho đến thiết kế khung máy DGX được đơn giản hóa hoàn toàn, không cần cáp. Vera Rubin là một sự tái cấu trúc toàn diện từ chip đến hệ thống.
Ông Huang đã trình diễn một POD Vera Rubin chứa 1152 GPU, tủ máy nặng khoảng 2 tấn, bên trong có khoảng 3.2 km cáp đồng. Mặc dù hiệu năng tăng vọt, hệ thống tản nhiệt của nó chỉ cần nước ở 45 độ C, cho thấy hiệu quả năng lượng đáng kể. Ông kết luận rằng Vera Rubin sẽ giúp giảm số lượng hệ thống cần thiết để huấn luyện một mô hình lớn với 10 nghìn tỷ tham số xuống chỉ bằng một phần tư so với Blackwell, đồng thời chi phí suy luận giảm đi một bậc. Đây là "một bước nhảy vọt khổng lồ hướng tới ranh giới tiếp theo của AI."
Ông Huang cũng cho biết thêm: "Nếu Vera Rubin muốn ra mắt trong năm nay, thì hiện tại nó phải đang trong quá trình sản xuất. Hôm nay tôi có thể nói với các bạn rằng Vera Rubin đang được sản xuất hết công suất."
**Hệ sinh thái và tương lai – Phổ cập robot và số hóa công nghiệp**
Cuối cùng, ông Huang mở rộng tầm nhìn sang các ngành công nghiệp rộng lớn hơn. Ông công bố hợp tác quan trọng với Siemens, tích hợp sâu mô hình AI vật lý của NVIDIA và nền tảng bản sao số Omniverse vào phần mềm công nghiệp và hệ thống tự động hóa của Siemens, cùng nhau thúc đẩy cuộc cách mạng số hóa toàn diện từ thiết kế chip, quy hoạch nhà máy đến vận hành sản xuất.
"Ban đầu, chính họ (các công ty EDA và phần mềm công nghiệp) đã tạo ra NVIDIA, và giờ đây chúng tôi vinh dự được sử dụng công nghệ đã tạo ra để cách mạng hóa ngành của họ," ông Huang nói.
Bài phát biểu kết thúc trong một không khí đầy tính tương lai. Ông Huang tổng kết rằng ô tô tự lái chỉ là thị trường chính đầu tiên của AI vật lý. Cùng một bộ công nghệ (ba máy tính, tạo dữ liệu tổng hợp, mô phỏng) đang thúc đẩy cuộc cách mạng robot, từ cánh tay robot đến robot hình người. Ông đã mời nhiều đối tác robot lên sân khấu và nói đùa rằng: "Thời khắc ChatGPT của lĩnh vực robot sắp đến rồi."
Bài phát biểu lần này của ông Huang đã vượt xa phạm vi ra mắt một sản phẩm đơn lẻ, mà là một tuyên bố mang tính hệ thống về tương lai của ngành AI và điện toán trong thập kỷ tới. Thông qua việc công bố mã nguồn mở các mô hình quan trọng (Cosmos, AlphaMio) và ra mắt phần cứng đột phá (Vera Rubin), NVIDIA đang mạnh mẽ định nghĩa các tiêu chuẩn công nghệ và hạ tầng của kỷ nguyên "AI vật lý". Chiến lược cốt lõi của họ rõ ràng không thể nghi ngờ: với một hệ sinh thái mở toàn diện, họ muốn nắm giữ vững chắc mọi nút tính toán, từ trung tâm dữ liệu đến đầu ngón tay của robot. Một thế giới vật lý được điều khiển bởi AI, hòa quyện giữa ảo và thực, đang được NVIDIA đặt nền móng từng bước trong đêm nay.
Trong bài diễn thuyết này, ông không chỉ tuyên bố rằng trọng tâm phát triển của trí tuệ nhân tạo đang chuyển dịch từ "trí tuệ số" thuần túy sang "AI vật lý" – tức là AI có khả năng tương tác với thế giới thực. Ông còn trình làng hàng loạt công cụ mã nguồn mở cực kỳ mạnh mẽ, từ mô hình thế giới Cosmos, hệ thống lái tự động AlphaMio cho đến kiến trúc chip AI thế hệ mới Vera Rubin.
Tất cả đều thể hiện tham vọng của NVIDIA, một gã khổng lồ công nghệ toàn diện, muốn xây dựng mọi nền tảng cơ bản cho kỷ nguyên mới này, từ chip cấp thấp, hạ tầng cho đến các mô hình và ứng dụng hàng đầu. Khi nhu cầu về sức mạnh tính toán trong thời đại AI đang tăng lên không ngừng, NVIDIA vẫn đang nỗ lực nâng cấp tối đa các nền tảng tính toán của mình, nhằm chiếm lĩnh vị trí nền tảng sức mạnh tính toán khổng lồ của thế giới số.
**DeepSeek và lời nhắc nhở: Mã nguồn mở là động lực chính của đổi mới**
Mở đầu bài phát biểu, ông Huang đã nhìn lại lịch sử và chia sẻ một cách đầy cảm xúc rằng: "Cứ mỗi 10 đến 15 năm, ngành công nghiệp tính toán lại trải qua một cuộc chuyển đổi nền tảng." Ông nhấn mạnh rằng chúng ta hiện đang đồng thời trải qua hai cuộc chuyển đổi lớn. Thứ nhất là các ứng dụng đang chuyển sang xây dựng dựa trên AI làm cốt lõi. Thứ hai là toàn bộ mô hình phát triển và vận hành phần mềm đang được định hình lại, từ "lập trình" sang "huấn luyện", từ CPU sang GPU, và từ việc thực thi mã biên dịch sẵn sang tạo nội dung theo thời gian thực.
"Điều này có nghĩa là ngành công nghiệp tính toán trị giá khoảng 10 nghìn tỷ USD (tương đương khoảng 250 triệu tỷ VNĐ) trong thập kỷ qua đang được hiện đại hóa," ông Huang chỉ ra. Ông cũng cho biết nguồn vốn thúc đẩy cuộc cách mạng này đến từ việc chuyển dịch ngân sách nghiên cứu và phát triển toàn cầu sang AI, cùng với hàng tỷ USD (tương đương hàng chục nghìn tỷ VNĐ) đầu tư mạo hiểm.
Ông đặc biệt dành nhiều thời lượng để ca ngợi vai trò cách mạng của các mô hình mã nguồn mở, và một lần nữa bày tỏ sự kinh ngạc trước DeepSeek, một minh chứng cho thấy mã nguồn mở đang giúp AI lan rộng nhanh chóng, khiến không ai muốn bị bỏ lại phía sau. "Các mô hình mã nguồn mở đã chạm đến ranh giới công nghệ," ông Huang nói. Mặc dù vẫn còn khoảng 6 tháng chênh lệch giữa các mô hình mã nguồn mở hàng đầu và các mô hình độc quyền tiên tiến nhất, nhưng sự lặp lại nhanh chóng này đang kích hoạt sự đổi mới toàn cầu.
"Làm sao chúng ta có thể để bất kỳ ai bị bỏ lại phía sau trong hình thái số của trí tuệ?" ông đặt câu hỏi. Bản thân NVIDIA cũng đã đầu tư hàng tỷ USD (tương đương hàng chục nghìn tỷ VNĐ) vào các cụm siêu máy tính DGX để thúc đẩy phát triển mô hình mã nguồn mở, và đã đạt được những đột phá trong nhiều lĩnh vực khoa học như dự đoán cấu trúc protein (Open Fold Three) và dự báo thời tiết (Forecast Net).
**Tác nhân thông minh và AI vật lý – Từ hiểu ngôn ngữ đến hiểu thế giới**
Ông Huang đã giải thích chi tiết về giai đoạn tiến hóa tiếp theo của khả năng AI: từ "ghi nhớ và tạo sinh" của các mô hình ngôn ngữ lớn sang "suy luận và hành động" của các tác nhân thông minh (Agent). Ông giải thích rằng các mô hình ban đầu thường tạo ra "ảo giác" vì chúng thiếu khả năng "nghiên cứu cơ bản" trước khi đưa ra câu trả lời. Trong khi đó, các khung tác nhân thông minh hiện đại có thể thực hiện suy luận theo chuỗi tư duy, chủ động lập kế hoạch các bước và gọi các công cụ, từ đó giải quyết những vấn đề mới chưa từng được huấn luyện rõ ràng.
"Điều này mở ra cánh cửa cho vô vàn ứng dụng. Chúng ta không còn cần phải huấn luyện AI hiểu mọi thứ ngay từ ngày đầu tiên," ông Huang chia sẻ. Kiến trúc tác nhân thông minh này về bản chất là đa mô hình, đa đám mây và hỗn hợp, có khả năng chọn mô hình tối ưu một cách linh hoạt tùy theo nhiệm vụ, đồng thời kết hợp với các mô hình tùy chỉnh riêng của doanh nghiệp, tạo nên khả năng AI vừa tiên tiến vừa độc quyền.
Tuy nhiên, thách thức thực sự nằm ở việc làm cho AI hiểu thế giới vật lý. "Một đứa trẻ cũng hiểu những kiến thức thông thường như vật thể tồn tại vĩnh viễn, trọng lực, ma sát, nhưng đối với AI thì hoàn toàn xa lạ," ông Huang chỉ ra. Điều này dẫn đến chủ đề cốt lõi của bài phát biểu: AI vật lý. Để đạt được điều này, chúng ta cần xây dựng một hệ thống hoàn chỉnh gồm ba máy tính: một để huấn luyện mô hình AI, một để suy luận theo thời gian thực trên robot hoặc ô tô ("điện toán biên"), và máy thứ ba dùng để mô phỏng vật lý độ chính xác cao, nhằm tạo ra dữ liệu huấn luyện và đánh giá mức độ an toàn của hành vi AI.
**Mô hình thế giới Cosmos và hệ thống lái tự động AlphaMio**
Sau đó, ông Huang đã giới thiệu một cách trang trọng giải pháp cốt lõi của NVIDIA để đối phó với thách thức AI vật lý: NVIDIA Cosmos. Đây là một mô hình nền tảng thế giới mã nguồn mở, "tiên tiến", không dựa trên ngôn ngữ mà dựa trên việc học từ video quy mô internet, dữ liệu lái xe thực tế và mô phỏng 3D, từ đó xây dựng một biểu diễn thống nhất về cách thế giới vận hành. Cosmos có thể tạo ra video chân thực từ một bức ảnh duy nhất, hoặc tạo ra quỹ đạo chuyển động hợp lý về mặt vật lý từ mô tả cảnh 3D. Quan trọng hơn, nó có thể phản ứng với các hành động của AI trong mô phỏng vòng lặp tương tác và thực hiện suy luận nhân quả.
"Cosmos biến tính toán thành dữ liệu," ông Huang nhấn mạnh. Điều này giải quyết được nút thắt cổ chai về chi phí và hiệu quả trong việc thu thập lượng lớn dữ liệu, đặc biệt là dữ liệu kịch bản "đuôi dài" (hiếm gặp) trong thế giới thực.
Dựa trên lượng lớn dữ liệu tổng hợp và dữ liệu thực tế được tạo ra bởi Cosmos, NVIDIA đã huấn luyện và công bố mã nguồn mở hệ thống lái tự động đầu tiên của mình – NVIDIA AlphaMio. Ông Huang tuyên bố đây là "AI lái xe tự động đầu tiên trên thế giới có khả năng suy nghĩ và suy luận." AlphaMio không chỉ xử lý đầu vào từ cảm biến và điều khiển phương tiện, mà còn có thể giải thích cho hành khách về hành động sắp thực hiện và quá trình suy luận đằng sau đó. Khả năng "giải thích" và suy luận để đối phó với các kịch bản không xác định này là chìa khóa để xử lý "vấn đề đuôi dài" trong lái xe tự động. Ông cũng thông báo rằng chiếc xe Mercedes-Benz đầu tiên được trang bị AlphaMio sẽ lăn bánh vào quý 1 năm 2026.
**Nhu cầu tính toán tăng vọt, Vera Rubin ra đời đúng lúc**
Đến nửa sau bài phát biểu, ông Huang cuối cùng đã trình làng "món chính" – kiến trúc chip mới đầy trọng lượng.
Đối mặt với thách thức về quy mô mô hình AI tăng gấp 10 lần mỗi năm và nhu cầu tính toán bùng nổ, ông Huang cho biết họ buộc phải thiết kế lại từng con chip. Ông chính thức tiết lộ kiến trúc chip AI thế hệ tiếp theo của NVIDIA: NVIDIA Vera Rubin. Tên gọi này được đặt theo tên nhà thiên văn học Vera Rubin, người đã khám phá ra vật chất tối, với ý nghĩa soi sáng những lĩnh vực chưa biết của điện toán AI.
"Rubin ra đời đúng lúc, bởi vì nhu cầu tính toán AI cho huấn luyện và suy luận đang tăng vọt," ông Huang chia sẻ. Ông giải thích rằng, trong bối cảnh Định luật Moore đang chậm lại, việc chỉ tăng nhẹ số lượng bóng bán dẫn (số lượng bóng bán dẫn của GPU Rubin chỉ gấp 1.6 lần so với Blackwell) không thể mang lại bước nhảy vọt về hiệu năng. Bí quyết của Vera Rubin nằm ở "thiết kế cộng tác cực đoan" – thiết kế lại hoàn toàn tất cả các chip trong công ty để chúng hoạt động như một hệ thống tổng thể. Ông cũng đồng thời giới thiệu 6 loại chip: Vera CPU, Rubin GPU, NVLink 6 Switch, card mạng thông minh ConnectX-9 (CX9), BlueField-4 DPU, Spectrum-X 102.4T CPO. Ông Huang đánh giá "mỗi con chip đều mang tính cách mạng" và xứng đáng có một buổi ra mắt riêng.
Vera CPU và Rubin GPU: CPU thế hệ mới có tỷ lệ hiệu năng trên điện năng tiêu thụ tăng gấp 2 lần, hiệu năng dấu phẩy động AI của GPU đạt gấp 5 lần so với Blackwell.
Lõi Tensor NVFP4 mang tính cách mạng: Đây là một bộ xử lý chuyên dụng có khả năng tự động điều chỉnh độ chính xác để tối ưu hóa thông lượng của mô hình Transformer. Ông Huang ca ngợi đây là "một công trình đột phá" và gợi ý rằng nó có thể trở thành tiêu chuẩn ngành trong tương lai.
Đổi mới toàn diện: Từ bộ chuyển mạch Ethernet Spectrum-X tích hợp quang tử silicon (với 512 cổng 200 Gb/s), đến BlueField-4 DPU được tái cấu trúc cho khối lượng công việc AI (dùng để quản lý bộ nhớ đệm ngữ cảnh KV đang tăng trưởng bùng nổ), cho đến thiết kế khung máy DGX được đơn giản hóa hoàn toàn, không cần cáp. Vera Rubin là một sự tái cấu trúc toàn diện từ chip đến hệ thống.
Ông Huang đã trình diễn một POD Vera Rubin chứa 1152 GPU, tủ máy nặng khoảng 2 tấn, bên trong có khoảng 3.2 km cáp đồng. Mặc dù hiệu năng tăng vọt, hệ thống tản nhiệt của nó chỉ cần nước ở 45 độ C, cho thấy hiệu quả năng lượng đáng kể. Ông kết luận rằng Vera Rubin sẽ giúp giảm số lượng hệ thống cần thiết để huấn luyện một mô hình lớn với 10 nghìn tỷ tham số xuống chỉ bằng một phần tư so với Blackwell, đồng thời chi phí suy luận giảm đi một bậc. Đây là "một bước nhảy vọt khổng lồ hướng tới ranh giới tiếp theo của AI."
Ông Huang cũng cho biết thêm: "Nếu Vera Rubin muốn ra mắt trong năm nay, thì hiện tại nó phải đang trong quá trình sản xuất. Hôm nay tôi có thể nói với các bạn rằng Vera Rubin đang được sản xuất hết công suất."
**Hệ sinh thái và tương lai – Phổ cập robot và số hóa công nghiệp**
Cuối cùng, ông Huang mở rộng tầm nhìn sang các ngành công nghiệp rộng lớn hơn. Ông công bố hợp tác quan trọng với Siemens, tích hợp sâu mô hình AI vật lý của NVIDIA và nền tảng bản sao số Omniverse vào phần mềm công nghiệp và hệ thống tự động hóa của Siemens, cùng nhau thúc đẩy cuộc cách mạng số hóa toàn diện từ thiết kế chip, quy hoạch nhà máy đến vận hành sản xuất.
"Ban đầu, chính họ (các công ty EDA và phần mềm công nghiệp) đã tạo ra NVIDIA, và giờ đây chúng tôi vinh dự được sử dụng công nghệ đã tạo ra để cách mạng hóa ngành của họ," ông Huang nói.
Bài phát biểu kết thúc trong một không khí đầy tính tương lai. Ông Huang tổng kết rằng ô tô tự lái chỉ là thị trường chính đầu tiên của AI vật lý. Cùng một bộ công nghệ (ba máy tính, tạo dữ liệu tổng hợp, mô phỏng) đang thúc đẩy cuộc cách mạng robot, từ cánh tay robot đến robot hình người. Ông đã mời nhiều đối tác robot lên sân khấu và nói đùa rằng: "Thời khắc ChatGPT của lĩnh vực robot sắp đến rồi."
Bài phát biểu lần này của ông Huang đã vượt xa phạm vi ra mắt một sản phẩm đơn lẻ, mà là một tuyên bố mang tính hệ thống về tương lai của ngành AI và điện toán trong thập kỷ tới. Thông qua việc công bố mã nguồn mở các mô hình quan trọng (Cosmos, AlphaMio) và ra mắt phần cứng đột phá (Vera Rubin), NVIDIA đang mạnh mẽ định nghĩa các tiêu chuẩn công nghệ và hạ tầng của kỷ nguyên "AI vật lý". Chiến lược cốt lõi của họ rõ ràng không thể nghi ngờ: với một hệ sinh thái mở toàn diện, họ muốn nắm giữ vững chắc mọi nút tính toán, từ trung tâm dữ liệu đến đầu ngón tay của robot. Một thế giới vật lý được điều khiển bởi AI, hòa quyện giữa ảo và thực, đang được NVIDIA đặt nền móng từng bước trong đêm nay.