Cơn sốt AI bước sang giai đoạn "thực dụng": Không cần mạnh nhất hay nhanh nhất, rẻ là được

The Storm Riders · 11:25

Trong giai đoạn đầu của cơn sốt AI tạo sinh, nhiều doanh nghiệp sẵn sàng chi mạnh cho các mô hình lớn và đắt tiền nhất, với niềm tin rằng dùng AI càng nhiều thì năng suất càng tăng. Nhưng khi hóa đơn bắt đầu phình to ngoài dự kiến, cách nhìn này đang thay đổi rất nhanh.

Ngày càng nhiều lãnh đạo công nghệ cho rằng tương lai của AI trong doanh nghiệp không nhất thiết nằm ở những mô hình mạnh nhất, mà ở những mô hình đủ tốt, đủ rẻ và phù hợp với từng tác vụ cụ thể. Satya Nadella của Microsoft, Nikesh Arora của Palo Alto Networks hay Brian Armstrong của Coinbase đều từng nhấn mạnh rằng các mô hình nhỏ hơn, rẻ hơn có thể xử lý phần lớn nhu cầu thông thường của doanh nghiệp.

Sự thay đổi này đến từ một thực tế khá đau đầu: chi phí AI đang ngày càng khó dự đoán. Giá token, đơn vị dùng để tính mức sử dụng AI, có xu hướng giảm. Tuy nhiên, tổng chi phí để hoàn thành một tác vụ lại có thể tăng lên vì các hệ thống AI hiện nay phải xử lý đầu vào dài hơn, nhiều dữ liệu hơn và nhiều bước suy luận hơn.

Mô hình định giá cũng đang thay đổi. Thay vì các gói thuê bao cố định dễ kiểm soát, nhiều nhà cung cấp AI chuyển sang tính phí theo mức sử dụng. Điều này khiến các công ty rất khó biết trước một tác vụ sẽ tiêu tốn bao nhiêu, nhất là khi nhân viên bắt đầu dùng AI hàng loạt cho lập trình, phân tích dữ liệu, chăm sóc khách hàng hoặc tự động hóa quy trình nội bộ.

Một ví dụ được nhắc đến là Uber. Công ty này được cho là đã dùng hết ngân sách AI của cả năm 2026 chỉ trong bốn tháng, sau khi nhân viên đổ xô sử dụng các công cụ AI hỗ trợ lập trình. Ban lãnh đạo sau đó phải áp giới hạn sử dụng để kiểm soát chi phí.

Theo Gartner, chi phí AI cho lập trình có thể vượt mức lương trung bình của một lập trình viên vào năm 2028. Một khảo sát của hãng nghiên cứu này cũng cho thấy ba phần tư lãnh đạo doanh nghiệp dự báo ngân sách công nghệ sẽ tăng trong năm nay, trong đó gần một nửa cho rằng mức tăng sẽ lên tới hai chữ số.

Áp lực chi phí khiến doanh nghiệp bắt đầu phân loại lại cách dùng AI. Những tác vụ phức tạp như viết mã khó, phân tích chuyên sâu hoặc xử lý tình huống nhiều ràng buộc vẫn có thể cần mô hình cao cấp. Nhưng với các việc đơn giản hơn như tóm tắt, phân loại, soạn nháp, trích xuất dữ liệu hay trả lời câu hỏi nội bộ, mô hình rẻ hơn có thể là lựa chọn hợp lý hơn nhiều.

Các công cụ định tuyến mô hình vì vậy đang được chú ý. Thay vì mặc định đưa mọi yêu cầu vào mô hình đắt nhất, doanh nghiệp có thể dùng các nền tảng như OpenRouter để chọn mô hình phù hợp nhất cho từng tác vụ, cân bằng giữa chất lượng, tốc độ và chi phí.

Xu hướng này cũng mở cửa cho các mô hình mã nguồn mở và mô hình Trung Quốc như DeepSeek. Theo ghi nhận của Citi, tỷ lệ token mã nguồn mở được xử lý trên OpenRouter đã tăng từ 34% trong tháng 1 lên 65% trong tháng 6. Bốn mô hình phổ biến nhất trên OpenRouter hiện đều đến từ Trung Quốc, trong đó DeepSeek giữ vị trí dẫn đầu.

Lợi thế lớn nhất của các mô hình này là giá. Một số mô hình Trung Quốc tính phí chỉ khoảng 0,18 USD cho mỗi một triệu token, trong khi mức trung bình của các mô hình hàng đầu là khoảng 4 USD. Khoảng cách năng lực cũng đang thu hẹp. Nếu trước đây mô hình mã nguồn mở thường bị xem là chậm hơn các mô hình dẫn đầu hơn một năm, hiện khoảng cách này được ước tính chỉ còn vài tháng.

Dù vậy, mô hình rẻ hơn không đồng nghĩa với việc doanh nghiệp sẽ chuyển hoàn toàn sang một lựa chọn duy nhất. Với các ngành nhạy cảm như an ninh mạng, tài chính hoặc dữ liệu doanh nghiệp quan trọng, lo ngại về bảo mật và quyền kiểm soát dữ liệu vẫn là rào cản lớn, đặc biệt với các mô hình đến từ Trung Quốc.

Kịch bản hợp lý hơn là doanh nghiệp sẽ dùng AI giống cách họ dùng điện toán đám mây: không phụ thuộc vào một nhà cung cấp duy nhất, mà phân bổ tác vụ cho nhiều mô hình khác nhau. Mô hình cao cấp sẽ được giữ cho những việc thật sự cần độ chính xác và khả năng suy luận tốt nhất, còn các mô hình rẻ hơn sẽ đảm nhận phần việc phổ thông với chi phí thấp hơn.

Điều này có thể tạo ra áp lực lớn lên những công ty AI đang định giá cao dịch vụ của mình. OpenAI và Anthropic được cho là có thể phải bước vào một cuộc cạnh tranh giá mạnh hơn, nhất là khi khách hàng doanh nghiệp ngày càng nhạy cảm với chi phí và các mô hình thay thế ngày càng tốt.

Cơn sốt AI vì vậy đang bước sang giai đoạn thực dụng hơn. Doanh nghiệp không còn chỉ hỏi “mô hình nào thông minh nhất”, mà bắt đầu hỏi “mô hình nào đủ tốt với chi phí hợp lý nhất”. Và trong cuộc chơi mới này, AI rẻ hơn chưa chắc kém hấp dẫn hơn; đôi khi nó mới là thứ giúp AI được triển khai rộng rãi thật sự.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Cơn sốt AI bước sang giai đoạn "thực dụng": Không cần mạnh nhất hay nhanh nhất, rẻ là được

The Storm Riders

Writer

The Storm Riders

AI Trung Quốc bắt kịp Mỹ về khả năng săn lỗi bảo mật, không thua gì Mythos?

Trung Quốc ban hành bộ tiêu chuẩn AI mới: Thúc đẩy kết nối tác nhân thông minh, dẫn dắt phát triển chất lượng cao

Hệ sinh thái AI đám mây mở: Cuộc cách mạng chuyển đổi số ngành thể thao

Apple tăng giá: Tại sao chúng tôi phải trả tiền cho giấc mơ AI của các người?

ChatGPT GPT-5.5: Trò chuyện tự nhiên hơn qua văn bản, còn chế độ giọng nói thì sao?

DSpark của Deepseek: Tạm biệt AI "bóp nghẹt", tốc độ tăng vọt đến 85%

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Chủ xe Honda SH125i, SH160i cần kiểm tra ngay: gần 90.000 xe nằm trong diện triệu hồi

Đánh giá nổi bật