Khôi Nguyên
Writer
Anthropic đã chính thức tạo ra một cơn địa chấn trong giới công nghệ AI khi tuyên bố đưa cửa sổ ngữ cảnh lên tới 1 triệu token chuyển từ giai đoạn thử nghiệm (beta) sang phiên bản phát hành chính thức (GA) trên hai mô hình chủ lực là Claude Opus 4.6 và Claude Sonnet 4.6. Không dừng lại ở việc nâng cấp sức chứa dữ liệu khổng lồ, thay đổi mang tính bước ngoặt nhất khiến các đối thủ cạnh tranh phải thực sự đau đầu chính là quyết định xóa bỏ hoàn toàn khoản phụ phí đắt đỏ mà các lập trình viên từng phải gánh chịu khi yêu cầu hệ thống xử lý những đoạn câu lệnh (prompt) siêu dài.
Song song với cuộc cách mạng về giá, nhà phát triển này còn mở rộng giới hạn xử lý dữ liệu đa phương tiện lên gấp 6 lần. Mỗi lượt gọi API hiện tại có thể đính kèm tối đa 600 hình ảnh hoặc trang tài liệu PDF, một bước nhảy vọt so với con số 100 trang của phiên bản trước. Nâng cấp này mang lại giá trị thực tiễn vô cùng to lớn cho các bộ phận pháp lý cần rà soát hàng trăm trang hợp đồng phức tạp, hoặc các chuyên gia nghiên cứu muốn phân tích chéo toàn bộ một kho tài liệu học thuật đồ sộ chỉ trong một lần thao tác duy nhất.
Đặc biệt, đối với công cụ lập trình dòng lệnh Claude Code, sức chứa 1 triệu token giờ đây đã trở thành tính năng mặc định cho các tài khoản thuộc gói Max, Team và Enterprise khi sử dụng mô hình Opus 4.6. Thay đổi này giải quyết triệt để vấn đề "nén dữ liệu" (compaction) từng gây nhiều phiền toái trong các phiên làm việc kéo dài. Trước đây, hệ thống thường xuyên phải tự động tóm tắt hoặc xóa bớt các đoạn hội thoại cũ để nhường chỗ cho dữ liệu mới, dẫn đến tình trạng AI bất ngờ "quên" mất các thông tin cấu hình quan trọng. Với không gian 1 triệu token, toàn bộ lịch sử lập trình và trao đổi đều được lưu giữ nguyên vẹn từ đầu đến cuối.
Khi đặt lên bàn cân cùng các đối thủ sừng sỏ, động thái táo bạo của Anthropic đã giúp Claude trở thành dòng mô hình duy nhất trên thị trường hỗ trợ 1 triệu token ở mức giá phẳng trên cả hai phiên bản mạnh nhất. Trong khi đó, mô hình Gemini 2.5 Pro của Google cũng sở hữu không gian 1 triệu token nhưng vẫn đang áp dụng chính sách thu thêm phụ phí khi người dùng vượt qua ranh giới 200.000 token. Ở một diễn biến khác, GPT-5.4 – mô hình tối tân nhất của OpenAI hiện nay – vẫn đang bị giới hạn phần cứng ở mức 256.000 token, còn phiên bản GPT-4.1 dù có 1 triệu token ở giá cố định nhưng lại không mang sức mạnh của một mẫu flagship. Sự kiện này đang tạo ra một sức ép cạnh tranh cực kỳ lớn, buộc các tập đoàn công nghệ hàng đầu phải nhanh chóng có lời giải cho bài toán chi phí và hiệu năng xử lý dữ liệu lớn.
Xóa bỏ rào cản chi phí và nâng cấp giới hạn tài liệu đa phương tiện
Trong quá khứ, khi tính năng này còn ở giai đoạn thử nghiệm, bất kỳ yêu cầu truy vấn nào vượt quá ngưỡng 200.000 token đầu vào đều bị áp dụng mức giá phạt vô cùng khắc nghiệt. Cụ thể, người dùng từng phải trả mức phí gấp đôi cho mỗi token đầu vào và gấp rưỡi cho token đầu ra. Giờ đây, chính sách định giá đã được Anthropic đồng nhất hoàn toàn bất kể độ dài của văn bản. Mô hình Opus 4.6 duy trì mức giá cố định 5 USD cho mỗi triệu token đầu vào và 25 USD cho đầu ra. Trong khi đó, phiên bản Sonnet 4.6 sở hữu mức giá dễ tiếp cận hơn là 3 USD và 15 USD cho các mốc tương ứng. Điều này đồng nghĩa với việc xử lý một khối lượng dữ liệu khổng lồ lên tới 900.000 token giờ đây được tính giá trung bình trên mỗi token y hệt như một câu lệnh 9.000 token thông thường.Song song với cuộc cách mạng về giá, nhà phát triển này còn mở rộng giới hạn xử lý dữ liệu đa phương tiện lên gấp 6 lần. Mỗi lượt gọi API hiện tại có thể đính kèm tối đa 600 hình ảnh hoặc trang tài liệu PDF, một bước nhảy vọt so với con số 100 trang của phiên bản trước. Nâng cấp này mang lại giá trị thực tiễn vô cùng to lớn cho các bộ phận pháp lý cần rà soát hàng trăm trang hợp đồng phức tạp, hoặc các chuyên gia nghiên cứu muốn phân tích chéo toàn bộ một kho tài liệu học thuật đồ sộ chỉ trong một lần thao tác duy nhất.
Tối ưu hóa kỹ thuật và giải quyết bài toán "quên" ngữ cảnh
Dưới góc độ kỹ thuật, sự chuyển đổi này diễn ra hoàn toàn liền mạch đối với giới lập trình viên phần mềm. Người dùng không cần phải thay đổi bất kỳ dòng mã (code) nào hay thiết lập thêm các đoạn mã tiêu đề (beta header) phức tạp để kích hoạt cửa sổ ngữ cảnh lớn như trước đây. Hệ thống mới sẽ tự động nhận diện và xử lý mượt mà các yêu cầu vượt mốc 200.000 token. Thậm chí, nếu mã nguồn hiện tại của nhà phát triển vẫn gửi kèm các tiêu đề cũ, hệ thống sẽ tự động bỏ qua để tránh gây ra lỗi gián đoạn dịch vụ.Đặc biệt, đối với công cụ lập trình dòng lệnh Claude Code, sức chứa 1 triệu token giờ đây đã trở thành tính năng mặc định cho các tài khoản thuộc gói Max, Team và Enterprise khi sử dụng mô hình Opus 4.6. Thay đổi này giải quyết triệt để vấn đề "nén dữ liệu" (compaction) từng gây nhiều phiền toái trong các phiên làm việc kéo dài. Trước đây, hệ thống thường xuyên phải tự động tóm tắt hoặc xóa bớt các đoạn hội thoại cũ để nhường chỗ cho dữ liệu mới, dẫn đến tình trạng AI bất ngờ "quên" mất các thông tin cấu hình quan trọng. Với không gian 1 triệu token, toàn bộ lịch sử lập trình và trao đổi đều được lưu giữ nguyên vẹn từ đầu đến cuối.
Định hình lại cục diện cạnh tranh trên thị trường AI thế hệ mới
Để dập tắt những hoài nghi về việc mở rộng ngữ cảnh có thể làm phân tán sự tập trung và giảm độ sắc bén của AI, Anthropic đã công bố các kết quả kiểm tra hiệu năng đầy ấn tượng. Đáng chú ý nhất, mô hình Opus 4.6 đã xuất sắc đạt điểm số 78,3% trên bài kiểm tra MRCR v2 – một thước đo chuyên sâu về khả năng truy xuất và tìm kiếm thông tin ẩn giấu trong một lượng văn bản khổng lồ. Đây là thành tích cao nhất được ghi nhận trong số các mô hình AI tiên tiến hiện nay, minh chứng cho việc chất lượng phân tích không hề bị suy giảm khi khối lượng dữ liệu phình to. Phiên bản Sonnet 4.6 cũng duy trì được độ chính xác vô cùng ổn định xuyên suốt toàn bộ không gian 1 triệu token.Khi đặt lên bàn cân cùng các đối thủ sừng sỏ, động thái táo bạo của Anthropic đã giúp Claude trở thành dòng mô hình duy nhất trên thị trường hỗ trợ 1 triệu token ở mức giá phẳng trên cả hai phiên bản mạnh nhất. Trong khi đó, mô hình Gemini 2.5 Pro của Google cũng sở hữu không gian 1 triệu token nhưng vẫn đang áp dụng chính sách thu thêm phụ phí khi người dùng vượt qua ranh giới 200.000 token. Ở một diễn biến khác, GPT-5.4 – mô hình tối tân nhất của OpenAI hiện nay – vẫn đang bị giới hạn phần cứng ở mức 256.000 token, còn phiên bản GPT-4.1 dù có 1 triệu token ở giá cố định nhưng lại không mang sức mạnh của một mẫu flagship. Sự kiện này đang tạo ra một sức ép cạnh tranh cực kỳ lớn, buộc các tập đoàn công nghệ hàng đầu phải nhanh chóng có lời giải cho bài toán chi phí và hiệu năng xử lý dữ liệu lớn.