Dũng Đỗ
Writer
Tại triển lãm CES 2026 diễn ra ở Las Vegas đầu tháng 1 vừa qua, sự chú ý của giới công nghệ toàn cầu đã đổ dồn về Kling, mô hình trí tuệ nhân tạo tạo sinh video đến từ Kuaishou (Trung Quốc). Với khả năng tạo ra những thước phim chất lượng điện ảnh chỉ từ văn bản hoặc hình ảnh, Kling đang được đánh giá là đối trọng xứng tầm nhất hiện nay đối với Sora của OpenAI và Veo của Google, đồng thời mở ra kỷ nguyên mới cho ngành sản xuất nội dung số với chi phí thấp kỷ lục.
Cuộc cách mạng làm phim với ngân sách 2.000 USD
Minh chứng rõ nét nhất cho sức mạnh của Kling là sự ra đời của bộ phim khoa học viễn tưởng mang tên The Seeker. Stephan Bugaj, nhà làm phim từng đoạt giải Emmy, đã hợp tác với Kuaishou để sản xuất tác phẩm này chỉ trong vòng 6 tuần với đội ngũ vỏn vẹn hai người và ngân sách khiêm tốn 2.000 USD. Toàn bộ hình ảnh, âm nhạc và giọng nói nhân vật trong phim đều được tạo ra bởi Kling AI.
Ông Bugaj gọi đây là bộ phim AI thương mại đầu tiên trên thế giới và khẳng định công nghệ này đang thay đổi hoàn toàn cuộc chơi. Thay vì tiêu tốn hàng tháng trời cùng hàng trăm nghìn, thậm chí hàng triệu USD cho nhân sự và thiết bị, giờ đây một nhóm nhỏ có thể đáp ứng tất cả nhu cầu sản xuất một cách hiệu quả. Không chỉ dừng lại ở các dự án độc lập, Jason Zada, một đạo diễn đoạt giải Emmy khác, cũng tiết lộ studio Secret Level của ông đã dùng Kling để tạo ra một tuyển tập video và nhạc chủ đề Giáng sinh dài tới 1 giờ 45 phút chỉ trong chưa đầy hai tuần. Sự tiến bộ vượt bậc của phiên bản Kling mới nhất so với công nghệ của một năm trước đó đã khiến ngay cả những chuyên gia kỳ cựu cũng phải kinh ngạc.
Bước đột phá công nghệ với Kling 2.6
Điểm nhấn quan trọng tại CES 2026 là việc Kuaishou trình làng mô hình Kling 2.6 với khả năng tạo âm thanh và hình ảnh đồng thời. Đây là một bước tiến lớn so với quy trình sản xuất video AI truyền thống, nơi người dùng thường phải tạo hình ảnh không tiếng trước rồi mới lồng tiếng thủ công. Việc tích hợp quy trình hai trong một này giúp tăng tốc đáng kể hiệu quả sáng tạo và đảm bảo tính đồng bộ cao hơn cho thành phẩm.
Trước đó, nền tảng này cũng đã gây tiếng vang với Kling O1, mô hình video đa phương thức thống nhất đầu tiên trong ngành. Mô hình này có khả năng xử lý hình ảnh, video, chủ đề và văn bản trong một lời nhắc duy nhất, đồng thời cho phép chỉnh sửa hậu kỳ nhanh chóng thông qua các lệnh văn bản đơn giản như "thay đổi ban ngày thành hoàng hôn" hay "xóa người đứng xem". Sự đơn giản hóa này được xem là nỗ lực "dân chủ hóa" việc sản xuất video, trao quyền cho bất kỳ ai có trí tưởng tượng phong phú đều có thể trở thành đạo diễn.
Con số biết nói và vị thế trên thị trường quốc tế
Kể từ khi ra mắt tại Trung Quốc vào tháng 6/2024, Kling đã đạt được những con số tăng trưởng ấn tượng. Tính đến nay, nền tảng đã tạo ra hơn 600 triệu video và thu hút hơn 60 triệu người dùng toàn cầu. Đến cuối năm 2025, hơn 30.000 doanh nghiệp và nhà phát triển đã tích hợp giao diện lập trình ứng dụng (API) của Kling. Về mặt tài chính, doanh thu của nền tảng trong năm 2025 đạt 140 triệu USD, vượt xa mục tiêu 60 triệu USD ban đầu. Đáng chú ý, theo số liệu từ Sensor Tower, khoảng 70% doanh thu này đến từ các thị trường nước ngoài, trong đó Mỹ chiếm tới một phần ba, cho thấy sức hút của công nghệ Trung Quốc ngay tại sân nhà của các đối thủ lớn.
Dù vậy, Kling vẫn phải đối mặt với sự cạnh tranh khốc liệt. Tại thị trường nội địa, hàng loạt cái tên sừng sỏ như Jimeng (ByteDance), Wan (Alibaba), Hunyuan (Tencent) hay các startup như Hailuo và Vidu đang bám đuổi quyết liệt. Trên bình diện quốc tế, lòng trung thành của người dùng vẫn là một dấu hỏi lớn. Ông Li Brian, giám đốc một đài truyền hình tại Bắc Kinh, cảnh báo rằng người dùng trong ngành đang chuyển đổi liên tục giữa các nền tảng tùy theo tốc độ cập nhật tính năng mới.
Những hạn chế và tương lai của ngành công nghiệp
Mặc dù được đánh giá cao về khả năng tạo nhân vật chân thực và chuyển động phức tạp, Kling vẫn tồn tại những điểm yếu so với các đối thủ hàng đầu. Nhà sản xuất phim Zhong Zhong tại Thượng Hải cho biết cô vẫn ưu tiên sử dụng Sora 2 của OpenAI cho các nhiệm vụ tiền sản xuất do khả năng duy trì tính nhất quán của cảnh quay và xử lý cảm xúc nhân vật tốt hơn.
Tuy nhiên, không thể phủ nhận rằng AI tạo sinh video đang trở thành một phần không thể thiếu của ngành công nghiệp giải trí. Theo báo cáo tháng 10/2025, số lượng người dùng AI tạo sinh tại Trung Quốc đã tăng gấp đôi lên 515 triệu người chỉ trong 6 tháng. Tập đoàn Tencent thậm chí còn đưa ra dự báo táo bạo rằng trong hai năm tới, một phần ba số lượng phim điện ảnh và phim hoạt hình sẽ bị chi phối hoặc có sự tham gia sâu rộng của trí tuệ nhân tạo, đánh dấu sự chuyển dịch không thể đảo ngược của lịch sử điện ảnh.
Cuộc cách mạng làm phim với ngân sách 2.000 USD
Minh chứng rõ nét nhất cho sức mạnh của Kling là sự ra đời của bộ phim khoa học viễn tưởng mang tên The Seeker. Stephan Bugaj, nhà làm phim từng đoạt giải Emmy, đã hợp tác với Kuaishou để sản xuất tác phẩm này chỉ trong vòng 6 tuần với đội ngũ vỏn vẹn hai người và ngân sách khiêm tốn 2.000 USD. Toàn bộ hình ảnh, âm nhạc và giọng nói nhân vật trong phim đều được tạo ra bởi Kling AI.
Ông Bugaj gọi đây là bộ phim AI thương mại đầu tiên trên thế giới và khẳng định công nghệ này đang thay đổi hoàn toàn cuộc chơi. Thay vì tiêu tốn hàng tháng trời cùng hàng trăm nghìn, thậm chí hàng triệu USD cho nhân sự và thiết bị, giờ đây một nhóm nhỏ có thể đáp ứng tất cả nhu cầu sản xuất một cách hiệu quả. Không chỉ dừng lại ở các dự án độc lập, Jason Zada, một đạo diễn đoạt giải Emmy khác, cũng tiết lộ studio Secret Level của ông đã dùng Kling để tạo ra một tuyển tập video và nhạc chủ đề Giáng sinh dài tới 1 giờ 45 phút chỉ trong chưa đầy hai tuần. Sự tiến bộ vượt bậc của phiên bản Kling mới nhất so với công nghệ của một năm trước đó đã khiến ngay cả những chuyên gia kỳ cựu cũng phải kinh ngạc.
Bước đột phá công nghệ với Kling 2.6
Điểm nhấn quan trọng tại CES 2026 là việc Kuaishou trình làng mô hình Kling 2.6 với khả năng tạo âm thanh và hình ảnh đồng thời. Đây là một bước tiến lớn so với quy trình sản xuất video AI truyền thống, nơi người dùng thường phải tạo hình ảnh không tiếng trước rồi mới lồng tiếng thủ công. Việc tích hợp quy trình hai trong một này giúp tăng tốc đáng kể hiệu quả sáng tạo và đảm bảo tính đồng bộ cao hơn cho thành phẩm.
Trước đó, nền tảng này cũng đã gây tiếng vang với Kling O1, mô hình video đa phương thức thống nhất đầu tiên trong ngành. Mô hình này có khả năng xử lý hình ảnh, video, chủ đề và văn bản trong một lời nhắc duy nhất, đồng thời cho phép chỉnh sửa hậu kỳ nhanh chóng thông qua các lệnh văn bản đơn giản như "thay đổi ban ngày thành hoàng hôn" hay "xóa người đứng xem". Sự đơn giản hóa này được xem là nỗ lực "dân chủ hóa" việc sản xuất video, trao quyền cho bất kỳ ai có trí tưởng tượng phong phú đều có thể trở thành đạo diễn.
Con số biết nói và vị thế trên thị trường quốc tế
Kể từ khi ra mắt tại Trung Quốc vào tháng 6/2024, Kling đã đạt được những con số tăng trưởng ấn tượng. Tính đến nay, nền tảng đã tạo ra hơn 600 triệu video và thu hút hơn 60 triệu người dùng toàn cầu. Đến cuối năm 2025, hơn 30.000 doanh nghiệp và nhà phát triển đã tích hợp giao diện lập trình ứng dụng (API) của Kling. Về mặt tài chính, doanh thu của nền tảng trong năm 2025 đạt 140 triệu USD, vượt xa mục tiêu 60 triệu USD ban đầu. Đáng chú ý, theo số liệu từ Sensor Tower, khoảng 70% doanh thu này đến từ các thị trường nước ngoài, trong đó Mỹ chiếm tới một phần ba, cho thấy sức hút của công nghệ Trung Quốc ngay tại sân nhà của các đối thủ lớn.
Dù vậy, Kling vẫn phải đối mặt với sự cạnh tranh khốc liệt. Tại thị trường nội địa, hàng loạt cái tên sừng sỏ như Jimeng (ByteDance), Wan (Alibaba), Hunyuan (Tencent) hay các startup như Hailuo và Vidu đang bám đuổi quyết liệt. Trên bình diện quốc tế, lòng trung thành của người dùng vẫn là một dấu hỏi lớn. Ông Li Brian, giám đốc một đài truyền hình tại Bắc Kinh, cảnh báo rằng người dùng trong ngành đang chuyển đổi liên tục giữa các nền tảng tùy theo tốc độ cập nhật tính năng mới.
Những hạn chế và tương lai của ngành công nghiệp
Mặc dù được đánh giá cao về khả năng tạo nhân vật chân thực và chuyển động phức tạp, Kling vẫn tồn tại những điểm yếu so với các đối thủ hàng đầu. Nhà sản xuất phim Zhong Zhong tại Thượng Hải cho biết cô vẫn ưu tiên sử dụng Sora 2 của OpenAI cho các nhiệm vụ tiền sản xuất do khả năng duy trì tính nhất quán của cảnh quay và xử lý cảm xúc nhân vật tốt hơn.
Tuy nhiên, không thể phủ nhận rằng AI tạo sinh video đang trở thành một phần không thể thiếu của ngành công nghiệp giải trí. Theo báo cáo tháng 10/2025, số lượng người dùng AI tạo sinh tại Trung Quốc đã tăng gấp đôi lên 515 triệu người chỉ trong 6 tháng. Tập đoàn Tencent thậm chí còn đưa ra dự báo táo bạo rằng trong hai năm tới, một phần ba số lượng phim điện ảnh và phim hoạt hình sẽ bị chi phối hoặc có sự tham gia sâu rộng của trí tuệ nhân tạo, đánh dấu sự chuyển dịch không thể đảo ngược của lịch sử điện ảnh.