Hoàng Đức
Writer
Năm 2025 sắp khép lại. Và như mọi năm, sẽ thật thiếu sót nếu chúng ta bỏ qua một bản tổng kết, nhất là với một lĩnh vực đã thay đổi thế giới nhanh đến mức gần như không kịp thích nghi: trí tuệ nhân tạo.
Cũng giống như game có TGA, điện ảnh có Oscar, âm nhạc có Grammy hay vô số bảng xếp hạng mang đậm dấu ấn cá nhân, tôi muốn dành bài viết này để chia sẻ lựa chọn “AI của năm” theo góc nhìn rất riêng của cá nhân. Không phải bảng xếp hạng khoa học, không phải đánh giá học thuật, càng không phải nội dung quảng bá. Tất cả chỉ dựa trên trải nghiệm thực tế, cảm nhận thị trường và cách tôi đã sử dụng AI trong suốt một năm qua.
Danh sách được chia làm hai phần: các mô hình AI quy mô lớn và các sản phẩm, tính năng AI tiêu biểu. Nếu bạn có quan điểm khác, hoặc thấy tôi bỏ sót điều gì đó, tôi rất sẵn sàng lắng nghe. Chỉ xin một điều, hãy coi đây là một cuộc trò chuyện, không phải một cuộc tranh cãi
.
Thành thật mà nói, ngay cả tôi cũng hơi bất ngờ khi trao danh hiệu này cho GPT-5.2 Thinking. Nhưng sau nhiều tháng sử dụng song song với Gemini 2.5 Pro và GPT-4.5, lựa chọn này trở nên khá rõ ràng.
Khả năng viết lách thường bị đánh giá thấp trong các bài review kỹ thuật. Người ta hay nói về benchmark, suy luận, tốc độ, nhưng lại ít nói về việc AI có viết “ra người” hay không. Với tôi, GPT-5.2 Thinking làm rất tốt ba điểm then chốt: tuân thủ chỉ dẫn, chuyển đổi phong cách và hiểu biết thế giới. Tỷ lệ ảo giác thấp, khả năng giữ giọng văn ổn định và cảm giác tự nhiên trong câu chữ khiến nó vượt lên trên hai đối thủ còn lại.
Khi kết hợp với các ràng buộc hệ thống nghiêm ngặt về cấu trúc câu và cách diễn đạt, GPT-5.2 Thinking cho ra những văn bản mà nếu không nói trước, rất khó nhận ra đó là sản phẩm của AI.
Mô hình lập trình của năm: Gemini 3.0 Pro
Tôi đã phân vân khá lâu giữa Claude 4.5 Opus, GPT-5.2 Codex và Gemini 3.0 Pro. Về năng lực thuần kỹ thuật, Claude và Codex đều cực kỳ mạnh. Nhưng với một người làm sản phẩm và trải nghiệm người dùng nhiều hơn là lập trình thuần túy, Gemini 3.0 Pro lại mang đến cảm giác khác.
Giao diện trực quan, thẩm mỹ cao, tương tác mượt và khả năng biến ý tưởng thành sản phẩm gần như tức thì khiến Gemini 3.0 Pro trở thành công cụ mà tôi mở lên thường xuyên nhất. Nó không chỉ giúp viết code, mà giúp “làm ra thứ gì đó” nhanh chóng, kể cả khi ý tưởng mới chỉ nằm trong đầu.
Mô hình tạo hình ảnh của năm: Nano Banana
Không phải Nano Banana Pro, mà chính phiên bản gốc Nano Banana mới là lựa chọn của tôi. Lý do rất đơn giản: cú sốc lần đầu tiên.
Nano Banana không chỉ tạo ra hình ảnh đẹp, nó tạo ra một làn sóng. Trong nửa đầu năm, độ phủ và sức lan tỏa của nó vượt xa nhiều mô hình khác, thậm chí giúp lấy lại uy tín cho mảng đồ họa AI sau giai đoạn Gemini 2.5 Flash gây thất vọng. Đây cũng là mô hình cho thấy rõ lợi thế của nền tảng đa phương thức gốc và khả năng tích hợp của các tập đoàn lớn.
Quan trọng hơn, Nano Banana khiến rất nhiều người lần đầu nhận ra rằng sáng tạo bằng AI có thể đơn giản đến vậy.
Mô hình âm nhạc của năm: Suno V5
Nếu phải chọn một “ông vua” trong lĩnh vực âm nhạc AI năm 2025, Suno V5 gần như không có đối thủ. Không chỉ nâng chất lượng nhạc AI lên một tầm mới, Suno còn tạo ra một làn sóng sáng tạo thực sự trong cộng đồng.
Từ những video nhái, parody cho đến các sản phẩm fanmade lan truyền mạnh mẽ, rất nhiều nhà sáng tạo vô danh đã được chú ý chỉ nhờ một ca khúc tạo bằng Suno. Cá nhân tôi, bài “The Great North, My Hometown” do Suno V5 tạo ra là ca khúc tôi nghe nhiều nhất trong năm.
Mô hình giọng nói của năm: MiniMax Speech 2.0
Khoảnh khắc MiniMax Speech 2.0 ra mắt vào ngày 15/05/2025 là lần đầu tiên tôi thực sự bị thuyết phục bởi giọng nói AI. Không phải vì nó rõ, mà vì nó có cảm xúc.
Buồn thì giọng run và thấp. Vui thì cao và nhẹ. Đó là lần đầu tôi cảm thấy giọng tổng hợp không còn “đọc”, mà đang “nói”. Dù các phiên bản sau còn tốt hơn, MiniMax Speech 2.0 vẫn xứng đáng là cột mốc của năm.
Mô hình video của năm: Sora 2
Video AI năm 2025 tiến rất nhanh, độ phân giải cao hơn, tham số lớn hơn, cập nhật liên tục hơn. Nhưng nếu hỏi mô hình nào vừa gây sốc, vừa khiến người ngoài ngành dừng lại xem, câu trả lời là Sora 2.
Khi kết hợp với ứng dụng Sora và cơ chế nhân vật, Sora 2 trở thành một hiện tượng toàn cầu. Nó vừa đủ thật, vừa đủ thú vị, đúng hai yếu tố quyết định sự lan truyền.
Mô hình lớn của năm 2025: DeepSeek R1
Nếu phải chọn một cái tên đại diện cho cả năm, tôi sẽ chọn DeepSeek R1.
Ra mắt ngày 20/01/2025, DeepSeek R1 không chỉ gây chú ý vì hiệu năng tiệm cận OpenAI o1, mà còn vì quyết định mã nguồn mở và mức giá API chỉ bằng khoảng 3,7%. Nó đưa AI từ một thứ xa vời trở thành chủ đề bàn luận đại chúng, đặc biệt trong dịp Tết Nguyên đán.
DeepSeek R1 không chỉ là một mô hình, nó là một sự kiện.
Dù có nhiều cảm xúc trái chiều với Claude, tôi không thể phủ nhận Claude Code là một công cụ lập trình xuất sắc. Khả năng thao tác trực tiếp với mã nguồn cục bộ, chỉnh sửa file, chạy lệnh và đóng gói quy trình làm việc khiến nó thực sự khác biệt.
Sản phẩm thiết kế AI của năm: Lovart
Lovart là tác nhân AI đầu tiên được thiết kế riêng cho thiết kế đồ họa. Từ bảng trắng, chỉnh sửa trực tiếp đến gợi ý ý tưởng, nó khiến câu hỏi “vì sao vẫn phải là Photoshop” trở nên rất hợp lý trong kỷ nguyên AI.
Tính năng AI của năm: Deep Research trên ChatGPT
Đây là công cụ đã thay đổi hoàn toàn cách tôi tìm kiếm thông tin. Đặt một câu hỏi, chờ từ 10 đến 30 phút, và nhận về một báo cáo mà trước đây phải mất hàng giờ hoặc hàng ngày mới làm được. Từ phân tích thị trường đến kiểm chứng thông tin, Deep Research gần như trở thành phản xạ mỗi khi tôi có thắc mắc.
Ứng dụng AI của năm: Manus
Bất chấp mọi tranh cãi, Manus đã mở ra kỷ nguyên của các đặc vụ AI toàn năng. Việc được Meta mua lại chỉ củng cố thêm vị thế lịch sử của nó. Dù gây tranh luận dữ dội, vai trò của Manus là không thể phủ nhận.
Phần cứng AI của năm: Plaude Note Pro
Plaude Note Pro tạo ra một danh mục phần cứng hoàn toàn mới. Ghi âm, phiên âm, tóm tắt, phân biệt người nói và biến cuộc họp thành ghi chú có cấu trúc. Doanh số một triệu thiết bị cho thấy đây không phải một ý tưởng viển vông.
Cũng giống như game có TGA, điện ảnh có Oscar, âm nhạc có Grammy hay vô số bảng xếp hạng mang đậm dấu ấn cá nhân, tôi muốn dành bài viết này để chia sẻ lựa chọn “AI của năm” theo góc nhìn rất riêng của cá nhân. Không phải bảng xếp hạng khoa học, không phải đánh giá học thuật, càng không phải nội dung quảng bá. Tất cả chỉ dựa trên trải nghiệm thực tế, cảm nhận thị trường và cách tôi đã sử dụng AI trong suốt một năm qua.
Danh sách được chia làm hai phần: các mô hình AI quy mô lớn và các sản phẩm, tính năng AI tiêu biểu. Nếu bạn có quan điểm khác, hoặc thấy tôi bỏ sót điều gì đó, tôi rất sẵn sàng lắng nghe. Chỉ xin một điều, hãy coi đây là một cuộc trò chuyện, không phải một cuộc tranh cãi
Mô hình lớn của năm 2025
Mô hình viết luận của năm: GPT-5.2 ThinkingThành thật mà nói, ngay cả tôi cũng hơi bất ngờ khi trao danh hiệu này cho GPT-5.2 Thinking. Nhưng sau nhiều tháng sử dụng song song với Gemini 2.5 Pro và GPT-4.5, lựa chọn này trở nên khá rõ ràng.
Khả năng viết lách thường bị đánh giá thấp trong các bài review kỹ thuật. Người ta hay nói về benchmark, suy luận, tốc độ, nhưng lại ít nói về việc AI có viết “ra người” hay không. Với tôi, GPT-5.2 Thinking làm rất tốt ba điểm then chốt: tuân thủ chỉ dẫn, chuyển đổi phong cách và hiểu biết thế giới. Tỷ lệ ảo giác thấp, khả năng giữ giọng văn ổn định và cảm giác tự nhiên trong câu chữ khiến nó vượt lên trên hai đối thủ còn lại.
Khi kết hợp với các ràng buộc hệ thống nghiêm ngặt về cấu trúc câu và cách diễn đạt, GPT-5.2 Thinking cho ra những văn bản mà nếu không nói trước, rất khó nhận ra đó là sản phẩm của AI.
Mô hình lập trình của năm: Gemini 3.0 Pro
Tôi đã phân vân khá lâu giữa Claude 4.5 Opus, GPT-5.2 Codex và Gemini 3.0 Pro. Về năng lực thuần kỹ thuật, Claude và Codex đều cực kỳ mạnh. Nhưng với một người làm sản phẩm và trải nghiệm người dùng nhiều hơn là lập trình thuần túy, Gemini 3.0 Pro lại mang đến cảm giác khác.
Giao diện trực quan, thẩm mỹ cao, tương tác mượt và khả năng biến ý tưởng thành sản phẩm gần như tức thì khiến Gemini 3.0 Pro trở thành công cụ mà tôi mở lên thường xuyên nhất. Nó không chỉ giúp viết code, mà giúp “làm ra thứ gì đó” nhanh chóng, kể cả khi ý tưởng mới chỉ nằm trong đầu.
Mô hình tạo hình ảnh của năm: Nano Banana
Không phải Nano Banana Pro, mà chính phiên bản gốc Nano Banana mới là lựa chọn của tôi. Lý do rất đơn giản: cú sốc lần đầu tiên.
Nano Banana không chỉ tạo ra hình ảnh đẹp, nó tạo ra một làn sóng. Trong nửa đầu năm, độ phủ và sức lan tỏa của nó vượt xa nhiều mô hình khác, thậm chí giúp lấy lại uy tín cho mảng đồ họa AI sau giai đoạn Gemini 2.5 Flash gây thất vọng. Đây cũng là mô hình cho thấy rõ lợi thế của nền tảng đa phương thức gốc và khả năng tích hợp của các tập đoàn lớn.
Quan trọng hơn, Nano Banana khiến rất nhiều người lần đầu nhận ra rằng sáng tạo bằng AI có thể đơn giản đến vậy.
Mô hình âm nhạc của năm: Suno V5
Nếu phải chọn một “ông vua” trong lĩnh vực âm nhạc AI năm 2025, Suno V5 gần như không có đối thủ. Không chỉ nâng chất lượng nhạc AI lên một tầm mới, Suno còn tạo ra một làn sóng sáng tạo thực sự trong cộng đồng.
Từ những video nhái, parody cho đến các sản phẩm fanmade lan truyền mạnh mẽ, rất nhiều nhà sáng tạo vô danh đã được chú ý chỉ nhờ một ca khúc tạo bằng Suno. Cá nhân tôi, bài “The Great North, My Hometown” do Suno V5 tạo ra là ca khúc tôi nghe nhiều nhất trong năm.
Mô hình giọng nói của năm: MiniMax Speech 2.0
Khoảnh khắc MiniMax Speech 2.0 ra mắt vào ngày 15/05/2025 là lần đầu tiên tôi thực sự bị thuyết phục bởi giọng nói AI. Không phải vì nó rõ, mà vì nó có cảm xúc.
Buồn thì giọng run và thấp. Vui thì cao và nhẹ. Đó là lần đầu tôi cảm thấy giọng tổng hợp không còn “đọc”, mà đang “nói”. Dù các phiên bản sau còn tốt hơn, MiniMax Speech 2.0 vẫn xứng đáng là cột mốc của năm.
Mô hình video của năm: Sora 2
Video AI năm 2025 tiến rất nhanh, độ phân giải cao hơn, tham số lớn hơn, cập nhật liên tục hơn. Nhưng nếu hỏi mô hình nào vừa gây sốc, vừa khiến người ngoài ngành dừng lại xem, câu trả lời là Sora 2.
Khi kết hợp với ứng dụng Sora và cơ chế nhân vật, Sora 2 trở thành một hiện tượng toàn cầu. Nó vừa đủ thật, vừa đủ thú vị, đúng hai yếu tố quyết định sự lan truyền.
Mô hình lớn của năm 2025: DeepSeek R1
Nếu phải chọn một cái tên đại diện cho cả năm, tôi sẽ chọn DeepSeek R1.
Ra mắt ngày 20/01/2025, DeepSeek R1 không chỉ gây chú ý vì hiệu năng tiệm cận OpenAI o1, mà còn vì quyết định mã nguồn mở và mức giá API chỉ bằng khoảng 3,7%. Nó đưa AI từ một thứ xa vời trở thành chủ đề bàn luận đại chúng, đặc biệt trong dịp Tết Nguyên đán.
DeepSeek R1 không chỉ là một mô hình, nó là một sự kiện.
Sản phẩm và tính năng AI của năm
Sản phẩm lập trình AI của năm: Claude CodeDù có nhiều cảm xúc trái chiều với Claude, tôi không thể phủ nhận Claude Code là một công cụ lập trình xuất sắc. Khả năng thao tác trực tiếp với mã nguồn cục bộ, chỉnh sửa file, chạy lệnh và đóng gói quy trình làm việc khiến nó thực sự khác biệt.
Sản phẩm thiết kế AI của năm: Lovart
Lovart là tác nhân AI đầu tiên được thiết kế riêng cho thiết kế đồ họa. Từ bảng trắng, chỉnh sửa trực tiếp đến gợi ý ý tưởng, nó khiến câu hỏi “vì sao vẫn phải là Photoshop” trở nên rất hợp lý trong kỷ nguyên AI.
Tính năng AI của năm: Deep Research trên ChatGPT
Đây là công cụ đã thay đổi hoàn toàn cách tôi tìm kiếm thông tin. Đặt một câu hỏi, chờ từ 10 đến 30 phút, và nhận về một báo cáo mà trước đây phải mất hàng giờ hoặc hàng ngày mới làm được. Từ phân tích thị trường đến kiểm chứng thông tin, Deep Research gần như trở thành phản xạ mỗi khi tôi có thắc mắc.
Ứng dụng AI của năm: Manus
Bất chấp mọi tranh cãi, Manus đã mở ra kỷ nguyên của các đặc vụ AI toàn năng. Việc được Meta mua lại chỉ củng cố thêm vị thế lịch sử của nó. Dù gây tranh luận dữ dội, vai trò của Manus là không thể phủ nhận.
Phần cứng AI của năm: Plaude Note Pro
Plaude Note Pro tạo ra một danh mục phần cứng hoàn toàn mới. Ghi âm, phiên âm, tóm tắt, phân biệt người nói và biến cuộc họp thành ghi chú có cấu trúc. Doanh số một triệu thiết bị cho thấy đây không phải một ý tưởng viển vông.