Cơn sốt AI bước sang giai đoạn "thực dụng": Không cần mạnh nhất hay nhanh nhất, rẻ là được

The Storm Riders
The Storm Riders
Phản hồi: 0
Trong giai đoạn đầu của cơn sốt AI tạo sinh, nhiều doanh nghiệp sẵn sàng chi mạnh cho các mô hình lớn và đắt tiền nhất, với niềm tin rằng dùng AI càng nhiều thì năng suất càng tăng. Nhưng khi hóa đơn bắt đầu phình to ngoài dự kiến, cách nhìn này đang thay đổi rất nhanh.

Ngày càng nhiều lãnh đạo công nghệ cho rằng tương lai của AI trong doanh nghiệp không nhất thiết nằm ở những mô hình mạnh nhất, mà ở những mô hình đủ tốt, đủ rẻ và phù hợp với từng tác vụ cụ thể. Satya Nadella của Microsoft, Nikesh Arora của Palo Alto Networks hay Brian Armstrong của Coinbase đều từng nhấn mạnh rằng các mô hình nhỏ hơn, rẻ hơn có thể xử lý phần lớn nhu cầu thông thường của doanh nghiệp.

1782793492954.png


Sự thay đổi này đến từ một thực tế khá đau đầu: chi phí AI đang ngày càng khó dự đoán. Giá token, đơn vị dùng để tính mức sử dụng AI, có xu hướng giảm. Tuy nhiên, tổng chi phí để hoàn thành một tác vụ lại có thể tăng lên vì các hệ thống AI hiện nay phải xử lý đầu vào dài hơn, nhiều dữ liệu hơn và nhiều bước suy luận hơn.

Mô hình định giá cũng đang thay đổi. Thay vì các gói thuê bao cố định dễ kiểm soát, nhiều nhà cung cấp AI chuyển sang tính phí theo mức sử dụng. Điều này khiến các công ty rất khó biết trước một tác vụ sẽ tiêu tốn bao nhiêu, nhất là khi nhân viên bắt đầu dùng AI hàng loạt cho lập trình, phân tích dữ liệu, chăm sóc khách hàng hoặc tự động hóa quy trình nội bộ.

Một ví dụ được nhắc đến là Uber. Công ty này được cho là đã dùng hết ngân sách AI của cả năm 2026 chỉ trong bốn tháng, sau khi nhân viên đổ xô sử dụng các công cụ AI hỗ trợ lập trình. Ban lãnh đạo sau đó phải áp giới hạn sử dụng để kiểm soát chi phí.

Theo Gartner, chi phí AI cho lập trình có thể vượt mức lương trung bình của một lập trình viên vào năm 2028. Một khảo sát của hãng nghiên cứu này cũng cho thấy ba phần tư lãnh đạo doanh nghiệp dự báo ngân sách công nghệ sẽ tăng trong năm nay, trong đó gần một nửa cho rằng mức tăng sẽ lên tới hai chữ số.

Áp lực chi phí khiến doanh nghiệp bắt đầu phân loại lại cách dùng AI. Những tác vụ phức tạp như viết mã khó, phân tích chuyên sâu hoặc xử lý tình huống nhiều ràng buộc vẫn có thể cần mô hình cao cấp. Nhưng với các việc đơn giản hơn như tóm tắt, phân loại, soạn nháp, trích xuất dữ liệu hay trả lời câu hỏi nội bộ, mô hình rẻ hơn có thể là lựa chọn hợp lý hơn nhiều.

Các công cụ định tuyến mô hình vì vậy đang được chú ý. Thay vì mặc định đưa mọi yêu cầu vào mô hình đắt nhất, doanh nghiệp có thể dùng các nền tảng như OpenRouter để chọn mô hình phù hợp nhất cho từng tác vụ, cân bằng giữa chất lượng, tốc độ và chi phí.

Xu hướng này cũng mở cửa cho các mô hình mã nguồn mở và mô hình Trung Quốc như DeepSeek. Theo ghi nhận của Citi, tỷ lệ token mã nguồn mở được xử lý trên OpenRouter đã tăng từ 34% trong tháng 1 lên 65% trong tháng 6. Bốn mô hình phổ biến nhất trên OpenRouter hiện đều đến từ Trung Quốc, trong đó DeepSeek giữ vị trí dẫn đầu.

Lợi thế lớn nhất của các mô hình này là giá. Một số mô hình Trung Quốc tính phí chỉ khoảng 0,18 USD cho mỗi một triệu token, trong khi mức trung bình của các mô hình hàng đầu là khoảng 4 USD. Khoảng cách năng lực cũng đang thu hẹp. Nếu trước đây mô hình mã nguồn mở thường bị xem là chậm hơn các mô hình dẫn đầu hơn một năm, hiện khoảng cách này được ước tính chỉ còn vài tháng.

Dù vậy, mô hình rẻ hơn không đồng nghĩa với việc doanh nghiệp sẽ chuyển hoàn toàn sang một lựa chọn duy nhất. Với các ngành nhạy cảm như an ninh mạng, tài chính hoặc dữ liệu doanh nghiệp quan trọng, lo ngại về bảo mật và quyền kiểm soát dữ liệu vẫn là rào cản lớn, đặc biệt với các mô hình đến từ Trung Quốc.

Kịch bản hợp lý hơn là doanh nghiệp sẽ dùng AI giống cách họ dùng điện toán đám mây: không phụ thuộc vào một nhà cung cấp duy nhất, mà phân bổ tác vụ cho nhiều mô hình khác nhau. Mô hình cao cấp sẽ được giữ cho những việc thật sự cần độ chính xác và khả năng suy luận tốt nhất, còn các mô hình rẻ hơn sẽ đảm nhận phần việc phổ thông với chi phí thấp hơn.

Điều này có thể tạo ra áp lực lớn lên những công ty AI đang định giá cao dịch vụ của mình. OpenAI và Anthropic được cho là có thể phải bước vào một cuộc cạnh tranh giá mạnh hơn, nhất là khi khách hàng doanh nghiệp ngày càng nhạy cảm với chi phí và các mô hình thay thế ngày càng tốt.

Cơn sốt AI vì vậy đang bước sang giai đoạn thực dụng hơn. Doanh nghiệp không còn chỉ hỏi “mô hình nào thông minh nhất”, mà bắt đầu hỏi “mô hình nào đủ tốt với chi phí hợp lý nhất”. Và trong cuộc chơi mới này, AI rẻ hơn chưa chắc kém hấp dẫn hơn; đôi khi nó mới là thứ giúp AI được triển khai rộng rãi thật sự.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9jb24tc290LWFpLWJ1b2Mtc2FuZy1naWFpLWRvYW4tdGh1Yy1kdW5nLWtob25nLWNhbi1tYW5oLW5oYXQtaGF5LW5oYW5oLW5oYXQtcmUtbGEtZHVvYy44NjQ0My8=
Top