Anthropic phải đổi luật sau phản ứng dữ dội khi AI bắt đầu che giấu việc tự giới hạn?

W
WuKong_top1
Phản hồi: 0
Một tranh cãi mới trong ngành AI vừa bùng lên sau khi Anthropic xác nhận sẽ thay đổi cách vận hành mô hình của mình: nếu một yêu cầu bị từ chối hoặc bị chuyển sang mức xử lý thấp hơn vì lý do an toàn hoặc an ninh quốc gia, người dùng sẽ được thông báo thay vì bị giới hạn trong im lặng.

Sự việc bắt đầu khi cộng đồng nghiên cứu phát hiện trong tài liệu kỹ thuật của mô hình Fable 5 rằng một số truy vấn, đặc biệt liên quan đến nghiên cứu AI tiên tiến có thể không được xử lý bằng mô hình mạnh nhất như người dùng nghĩ. Thay vào đó, hệ thống có thể chuyển sang một mô hình cũ hơn hoặc giảm mức hỗ trợ mà không hiện cảnh báo.
1781238630734.png

Ảnh minh họa: Gemini

Sau phản ứng dữ dội, Anthropic thừa nhận họ đã “đánh đổi sai” giữa tốc độ triển khai và tính minh bạch. Hãng cho biết từ nay các yêu cầu bị đánh dấu sẽ hiển thị rõ việc bị chuyển sang mô hình khác và API cũng trả về lý do từ chối.

Nhưng điều đáng chú ý hơn nằm ở phía sau quyết định này.

Thứ nhất: thời kỳ “mua AI là dùng toàn bộ AI” có thể đang kết thúc. Một chatbot giờ không còn là một mô hình cố định. Nó có thể là nhiều tầng năng lực khác nhau, kích hoạt tùy loại câu hỏi.

Thứ hai: cuộc chơi đang chuyển từ kiểm duyệt nội dung sang kiểm soát năng lực. Thay vì trả lời “tôi không thể làm điều này”, hệ thống có thể vẫn trả lời nhưng bằng một phiên bản kém mạnh hơn.

Thứ ba: an ninh quốc gia đang đi vào chính lõi sản phẩm AI. Anthropic giải thích rằng không muốn các mô hình mạnh bị dùng để hỗ trợ phát triển hệ AI cạnh tranh hoặc tối ưu năng lực cho các đối thủ chiến lược của một số quốc gia. Công ty nhấn mạnh các giới hạn này không áp dụng với phần lớn công việc lập trình hay máy học thông thường.​
 
Được phối hợp thực hiện bởi các chuyên gia của Bkav, cộng đồng An ninh mạng Việt Nam WhiteHat và cộng đồng Khoa học công nghệ VnReview


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9hbnRocm9waWMtcGhhaS1kb2ktbHVhdC1zYXUtcGhhbi11bmctZHUtZG9pLWtoaS1haS1iYXQtZGF1LWNoZS1naWF1LXZpZWMtdHUtZ2lvaS1oYW4uODQ5NDcv
Top