Anthropic phải đổi luật sau phản ứng dữ dội khi AI bắt đầu che giấu việc tự giới hạn?

Một tranh cãi mới trong ngành AI vừa bùng lên sau khi Anthropic xác nhận sẽ thay đổi cách vận hành mô hình của mình: nếu một yêu cầu bị từ chối hoặc bị chuyển sang mức xử lý thấp hơn vì lý do an toàn hoặc an ninh quốc gia, người dùng sẽ được thông báo thay vì bị giới hạn trong im lặng.

Sự việc bắt đầu khi cộng đồng nghiên cứu phát hiện trong tài liệu kỹ thuật của mô hình Fable 5 rằng một số truy vấn, đặc biệt liên quan đến nghiên cứu AI tiên tiến có thể không được xử lý bằng mô hình mạnh nhất như người dùng nghĩ. Thay vào đó, hệ thống có thể chuyển sang một mô hình cũ hơn hoặc giảm mức hỗ trợ mà không hiện cảnh báo.

Ảnh minh họa: Gemini

Sau phản ứng dữ dội, Anthropic thừa nhận họ đã “đánh đổi sai” giữa tốc độ triển khai và tính minh bạch. Hãng cho biết từ nay các yêu cầu bị đánh dấu sẽ hiển thị rõ việc bị chuyển sang mô hình khác và API cũng trả về lý do từ chối.

Nhưng điều đáng chú ý hơn nằm ở phía sau quyết định này.

Thứ nhất: thời kỳ “mua AI là dùng toàn bộ AI” có thể đang kết thúc. Một chatbot giờ không còn là một mô hình cố định. Nó có thể là nhiều tầng năng lực khác nhau, kích hoạt tùy loại câu hỏi.

Thứ hai: cuộc chơi đang chuyển từ kiểm duyệt nội dung sang kiểm soát năng lực. Thay vì trả lời “tôi không thể làm điều này”, hệ thống có thể vẫn trả lời nhưng bằng một phiên bản kém mạnh hơn.

Thứ ba: an ninh quốc gia đang đi vào chính lõi sản phẩm AI. Anthropic giải thích rằng không muốn các mô hình mạnh bị dùng để hỗ trợ phát triển hệ AI cạnh tranh hoặc tối ưu năng lực cho các đối thủ chiến lược của một số quốc gia. Công ty nhấn mạnh các giới hạn này không áp dụng với phần lớn công việc lập trình hay máy học thông thường.

Được phối hợp thực hiện bởi các chuyên gia của Bkav, cộng đồng An ninh mạng Việt Nam WhiteHat và cộng đồng Khoa học công nghệ VnReview

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Rót 50 tỷ USD vào Anthropic, Microsoft lại cấm tiệt nhân viên dùng Claude Fable 5

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Anthropic phải đổi luật sau phản ứng dữ dội khi AI bắt đầu che giấu việc tự giới hạn?

WuKong_top1

Writer

WuKong_top1

Xem FIFA World Cup 2026 cũng cần lưu ý bản quyền

Mã độc macOS phát tán qua file DMG giả, người dùng Mac tiếp tục trở thành mục tiêu mới của infostealer

Nhóm ransomware The Gentlemen công khai 12 nạn nhân mới, nhiều doanh nghiệp và bệnh viện trên thế giới bị ảnh hưởng

Vì sao email liên quan đến thuế đang trở thành vũ khí phát tán RAT nguy hiểm?

Chỉ một bình luận trên TikTok có thể khiến máy tính nhiễm mã độc: Chuyên gia an ninh mạng cảnh báo

Bandizip bị phát hiện nguy cơ bị lợi dụng để qua mặt phần mềm diệt virus