Báo cáo dự đoán: AI 2026 sẽ chứng kiến robot hình người bùng nổ, dữ liệu tổng hợp lên ngôi

Jinu
Jinu
Phản hồi: 0

Jinu

Intern Writer
Năm 2025, trí tuệ nhân tạo (AI) không chỉ tiếp tục phát triển theo hướng nhanh hơn, mạnh hơn và đa năng hơn, mà còn hướng tới một xu thế mới: nhỏ gọn và tinh tế. Nhờ đó, AI đã mạnh dạn bước ra khỏi phòng thí nghiệm, hòa nhập vào các ứng dụng kinh doanh ở mọi ngành nghề với tốc độ đáng kinh ngạc. Khi bước sang năm 2026, chúng ta bắt đầu tò mò về những đặc điểm tiến hóa mới mà công nghệ AI sẽ mang lại. Mới đây, Viện Nghiên cứu Trí tuệ Nhân tạo Bắc Kinh (BAAI) đã công bố báo cáo "10 Xu hướng Công nghệ AI hàng đầu năm 2026", trong đó trình bày chi tiết nhiều xu hướng phát triển mới của AI như đa phương thức, AI hiện thân và các hệ thống tác tử thông minh.

Để AI có thể nhận thức và hiểu thế giới một cách toàn diện hơn, năm 2025 đã chứng kiến rất nhiều cuộc thảo luận và khám phá về AI đa phương thức. Dự kiến đến năm 2026, ngành công nghiệp sẽ tiếp tục đi sâu vào nghiên cứu các mô hình thế giới đa phương thức với kiến trúc gốc và khả năng mô phỏng vật lý, từ đó tạo ra những AI có thể hiểu và mô phỏng chính xác các quy luật của thế giới thực. Ông Vương Trọng Viễn, Viện trưởng Viện Nghiên cứu Trí tuệ Nhân tạo Bắc Kinh, chia sẻ rằng giá trị của mô hình thế giới nằm ở khả năng mô phỏng cách nhận thức của não bộ con người, hiểu các quy luật vận hành cơ bản của thế giới như vật lý, thời gian, không gian. Điều này giúp AI giải quyết tốt hơn những vấn đề mà con người thấy đơn giản nhưng máy móc lại khó xử lý.
53a0445330c045b3b725d8638755671b.jpeg

Năm 2025, AI hiện thân (Embodied AI) đã nở rộ như trăm hoa đua nở, nhưng năm 2026 có thể sẽ có những thay đổi lớn. Báo cáo chỉ ra rằng hiện tại Trung Quốc có hơn 230 công ty AI hiện thân, trong đó có hơn 100 công ty robot hình người, cho thấy một quy mô công nghiệp đáng kể. Tuy nhiên, trong bối cảnh kinh tế toàn cầu biến động và nguồn vốn đầu tư ngày càng thận trọng, lĩnh vực AI hiện thân có thể sẽ trải qua một đợt thanh lọc vào năm 2026. Các doanh nghiệp áp dụng mô hình "mô hình lớn mã nguồn mở chung + điều khiển chuyển động" để tối ưu hóa hoạt động trong các kịch bản đơn lẻ có thể vẫn còn chỗ đứng, nhưng sự tiến hóa tiếp theo vẫn bị hạn chế bởi sự phát triển của các mô hình nền tảng thượng nguồn. Trong khi đó, "tiểu não hiện thân" (embodied cerebellum) cố gắng nâng cao khả năng khái quát hóa ở phía vận hành để đối phó với các vấn đề phi tiêu chuẩn trong các kịch bản cụ thể, nhưng do khó thích ứng với môi trường thực tế nên vẫn còn khá xa mới có thể thương mại hóa. Báo cáo cho rằng cần xem xét việc đưa mô hình thế giới vào, đồng thời tự điều chỉnh thông qua cơ chế học tăng cường trong môi trường mô phỏng hoặc thực tế, hình thành một lộ trình tự tiến hóa mới.

Với sự trưởng thành dần của công nghệ, báo cáo dự đoán robot hình người sẽ có những bước tiến xa hơn vào thế giới thực trong năm 2026. Chẳng hạn, robot hình người Optimus 2.5 của Tesla Robotics đã được ứng dụng trong sản xuất tại nhà máy và vận hành trang trại. Robot dịch vụ Robbyant-R1 của Lingbo Tech (thuộc Ant Group), với mô hình nền tảng hiện thân tự phát triển, đã được đưa vào sử dụng trong các lĩnh vực dịch vụ đời sống như nhà hàng, hướng dẫn và tư vấn y tế. Được biết, ngành công nghiệp đã ghi nhận nhiều đơn hàng trị giá hàng trăm triệu nhân dân tệ (tương đương hàng chục triệu USD hoặc hàng nghìn tỷ VNĐ), với doanh số robot hình người đã vượt mốc 10.000 chiếc, đánh dấu bước đầu tiên vào giai đoạn thương mại hóa.

Khi các ứng dụng AI đi sâu vào các kịch bản phức tạp, việc nâng cấp từ tác tử đơn lẻ lên hệ thống đa tác tử sẽ trở thành điều tất yếu. Báo cáo chỉ ra rằng hệ thống đa tác tử có khả năng thích ứng tốt hơn với các quy trình làm việc phức tạp, đồng thời giảm thiểu "ảo giác" thông qua tự phản tư và tranh luận lẫn nhau. Từ góc độ khoa học nhận thức, tổng khả năng nhận thức của một nhóm thường vượt trội hơn so với cá thể thông minh nhất trong nhóm đó. Các học giả đã chứng minh rằng hệ thống đa tác tử có lợi thế rõ ràng so với hệ thống tác tử đơn lẻ trong các nhiệm vụ phức tạp. Để đẩy nhanh sự phát triển của đa tác tử, vào năm 2026, các giao thức giao tiếp giữa các tác tử (Agent) sẽ dần trưởng thành dưới sự thúc đẩy của các nhà sản xuất lớn, từ đó tiến tới giai đoạn thực hành trong các kịch bản sản xuất.

Trong lĩnh vực nghiên cứu khoa học, năm 2025 đã xuất hiện "AI Scientist" – một hệ thống tác tử thông minh có khả năng mô phỏng và thậm chí tự động thực hiện toàn bộ chuỗi nghiên cứu từ "đề xuất giả thuyết, thiết kế thí nghiệm, phân tích dữ liệu đến suy luận kết luận". Đây không chỉ là sự thay đổi về lượng trong hiệu quả nghiên cứu mà còn là sự thay đổi về chất trong mô hình khám phá khoa học. Đằng sau đó là ba động lực công nghệ chính: thứ nhất, các mô hình nền tảng khoa học cung cấp cơ sở lý thuyết, đồng thời thông qua phân tích lượng lớn tài liệu và dữ liệu khoa học, hình thành sự hiểu biết sâu sắc về các vấn đề khoa học cụ thể; thứ hai, quy trình làm việc của tác tử chuyển khả năng hiểu biết thành hành động, cho phép hệ thống AI tự chủ lập kế hoạch và thực hiện các nhiệm vụ nghiên cứu phức tạp gồm nhiều bước, linh hoạt sử dụng các công cụ bên ngoài như cơ sở dữ liệu, trình mô phỏng và công cụ tìm kiếm tài liệu; thứ ba, khả năng nhận thức của AI được kết nối với các cơ sở thí nghiệm tự động, hoàn thành vòng lặp từ mô phỏng số đến xác minh thí nghiệm thực tế, giúp việc khám phá khoa học tự chủ bởi AI trở thành hiện thực. Để đối phó với xu hướng này, vào tháng 11 năm 2025, Hoa Kỳ đã khởi động "Sứ mệnh Genesis", quyết định xây dựng một nền tảng thí nghiệm AI tích hợp, thiết lập cơ chế phối hợp liên ngành và cơ chế chia sẻ dữ liệu khoa học hiệu quả, nhằm đẩy nhanh quá trình nghiên cứu khoa học bằng công nghệ AI.

Báo cáo cũng chỉ ra rằng Trung Quốc vẫn chưa có phản ứng kịp thời trong lĩnh vực AI cho Khoa học. Hiện tại, Trung Quốc có lợi thế tương đối trong ứng dụng AI, nhưng vẫn đối mặt với những thách thức ở các mức độ khác nhau về ba cơ sở hạ tầng chính hỗ trợ AI cho Khoa học: năng lực tính toán, dữ liệu và mô hình. Về cơ sở hạ tầng tính toán, do bị hạn chế bởi các lệnh cấm từ nước ngoài và khoảng cách thay thế nội địa khó bù đắp trong ngắn hạn, tổng dự trữ vẫn chưa bằng Hoa Kỳ. Về dữ liệu, Trung Quốc đang dần xây dựng nền tảng dịch vụ chia sẻ tài nguyên khoa học công nghệ quốc gia – Trung tâm dữ liệu khoa học công cộng cơ bản quốc gia, do Viện Hàn lâm Khoa học Trung Quốc dẫn đầu, với sự tham gia của các viện nghiên cứu thuộc Bộ Giáo dục, Bộ Giao thông Vận tải, và đang có tiến triển tốt. Về mô hình, các mô hình nền tảng khoa học của Trung Quốc có phần chậm hơn, rất cần sự ưu tiên và tích hợp nguồn lực từ các bên.

Năm 2025, các ứng dụng AI cá nhân phát triển mạnh mẽ, với mô hình "kết nối API đa ngành + mô hình nền tảng" trở thành xu hướng chủ đạo. Ngành công nghiệp có xu hướng phát triển "siêu ứng dụng AI" để phá vỡ rào cản giữa các ứng dụng khác nhau, cung cấp dịch vụ "một cửa" cho người dùng cá nhân. Chẳng hạn, vào tháng 11 năm 2025, ChatGPT đã ra mắt tính năng "Buy it in chatgpt", kết nối nhiều nền tảng thương mại điện tử và thanh toán, cho phép người dùng chỉ cần một câu nói để bắt đầu quy trình, tìm đến sản phẩm ưng ý nhất và hoàn tất việc đặt hàng ngay trong ứng dụng ChatGPT. Báo cáo chỉ ra rằng siêu ứng dụng AI đòi hỏi năng lực tính toán cực cao và phụ thuộc vào lượng lớn người dùng hiện có để lặp lại dữ liệu mô hình. Do đó, điều này sẽ có lợi hơn cho các tập đoàn lớn và có khả năng tạo ra những gã khổng lồ mới trong kỷ nguyên AI.

Xung quanh các ứng dụng AI trong công nghiệp, cả trong và ngoài nước đã có rất nhiều khám phá. Ví dụ, AI đàm thoại đã trở nên trưởng thành trong các kịch bản như dịch vụ khách hàng, hỗ trợ viết mã và tiếp thị. Tuy nhiên, các ứng dụng AI Agent tự quyết định phức tạp hơn vẫn đang trong giai đoạn khám phá. Báo cáo dự đoán, năm 2026, các ứng dụng AI trong công nghiệp sẽ bước vào "thời kỳ suy thoái", với nhiều dự án đang được khám phá sẽ thất bại. Nguyên nhân bao gồm thiếu dữ liệu chất lượng cao, hệ thống đa tác tử chưa đủ trưởng thành, chi phí quá cao, v.v. Báo cáo nhấn mạnh rằng chất lượng dữ liệu và tích hợp hệ thống hiện có là những vấn đề cấp bách cần giải quyết, an toàn là điều kiện tiên quyết, sau đó mới đến các vấn đề như chi phí và sự tiến hóa của đa tác tử. Tất cả những điều này đòi hỏi ngành công nghiệp AI phải hợp tác với các bên liên quan để cùng nhau giải quyết.

Sự tiến hóa liên tục của công nghệ AI đòi hỏi dữ liệu chất lượng cao để học hỏi và huấn luyện. Tuy nhiên, dữ liệu văn bản chất lượng cao dự kiến sẽ cạn kiệt vào năm 2026, và dữ liệu văn bản chất lượng thấp cùng dữ liệu hình ảnh dự kiến sẽ dần cạn kiệt từ năm 2030. Sự thiếu hụt tài nguyên này sẽ thúc đẩy lộ trình công nghệ AI chuyển từ "chất đống dữ liệu" sang "dữ liệu tổng hợp + học tăng cường". Thông tin từ Frost&Sullivan cho thấy quy mô thị trường dữ liệu tổng hợp của Trung Quốc đã tăng vọt từ 1,18 tỷ nhân dân tệ (tương đương 163 triệu USD hoặc 4,1 nghìn tỷ VNĐ) lên 4,76 tỷ nhân dân tệ (tương đương 657 triệu USD hoặc 16,7 nghìn tỷ VNĐ) chỉ trong bốn năm. Dự kiến đến năm 2030, khối lượng dữ liệu tổng hợp toàn cầu sẽ chính thức vượt qua dữ liệu thực, trở thành nguồn nhiên liệu chủ đạo và tài sản chiến lược cho việc huấn luyện mô hình. Chẳng hạn, Tesla đang hợp tác với Đại học Thanh Hoa để nghiên cứu và phát triển OccWorld4D, thử nghiệm các điều kiện đường xá khắc nghiệt trong môi trường mô phỏng hoàn toàn do mô hình thế giới tạo ra, thay thế các thí nghiệm trong môi trường thực truyền thống. Lĩnh vực khám phá khoa học và AI hiện thân cũng sẽ ngày càng sử dụng nhiều dữ liệu tổng hợp, bao gồm việc hoàn thành hàng tỷ thí nghiệm sinh học phân tử trong thế giới ảo ngay lập tức, và cải thiện thiết kế robot thông qua mô phỏng.

Từ việc phụ thuộc vào dữ liệu thực đến việc sử dụng nhiều hơn dữ liệu tổng hợp, mô hình thế giới và học tăng cường sẽ là hai chìa khóa quan trọng. Mô hình thế giới là động cơ tạo ra dữ liệu cực kỳ giá trị, còn học tăng cường là bộ lọc giúp giảm đáng kể độc tính của dữ liệu. Sự kết hợp của cả hai có thể cung cấp đủ dữ liệu tổng hợp cho sự tiến hóa của công nghệ AI.

Với việc AI được ứng dụng rộng rãi, vấn đề an toàn của AI dần nhận được sự quan tâm. Báo cáo của Future of Life Institute chỉ ra rằng các mô hình lớn hàng đầu thế giới đều thể hiện kém trong việc "ngăn chặn lạm dụng thảm khốc hoặc mất kiểm soát". Các tác tử (Agent) được xây dựng dựa trên mô hình lớn không chỉ kế thừa các rủi ro an toàn của chính mô hình lớn, mà còn làm tăng sự bất ổn của các mô-đun bên ngoài như bộ nhớ, cũng như các rủi ro an toàn trong quá trình giao tiếp giữa các mô-đun, giữa mô-đun và công cụ, và giữa các công cụ với nhau. Vì vậy, ngành công nghiệp đã tiến hành một loạt nghiên cứu vào năm 2025. Một mặt, họ áp dụng phương pháp diễn tập tấn công và phòng thủ tự tiến hóa dựa trên hệ thống đa tác tử. Mặt khác, họ cố gắng chủ động hiểu AI từ bên trong. Ví dụ, Ant Group đã xây dựng hệ thống công nghệ "đối kháng tấn công dịch vụ trực tuyến, tăng cường bảo mật thiết bị đầu cuối ngoại tuyến", trong khi 360 đã xây dựng kiến trúc mô hình lớn bảo mật hợp tác phân vùng giống não bộ, nhanh chóng nhận diện các mối đe dọa và hành vi tấn công.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9iYW8tY2FvLWR1LWRvYW4tYWktMjAyNi1zZS1jaHVuZy1raWVuLXJvYm90LWhpbmgtbmd1b2ktYnVuZy1uby1kdS1saWV1LXRvbmctaG9wLWxlbi1uZ29pLjc4MzgyLw==
Top