Claude Mythos: "Quái vật AI" nguy hiểm hay chỉ là chiêu trò marketing?

The Storm Riders
The Storm Riders
Phản hồi: 0
Gần đây, cộng đồng công nghệ đang xôn xao trước thông tin về một mô hình trí tuệ nhân tạo mới mang tên Claude Mythos. Được chính đơn vị phát triển mô tả như một "quái vật AI" có khả năng đe dọa an ninh mạng toàn cầu, Anthropic đã quyết định không công khai rộng rãi hệ thống này vì lo ngại những rủi ro tiềm ẩn. Tuy nhiên, đằng sau những tuyên bố gây sốc về khả năng phát hiện hàng nghìn lỗ hổng bảo mật, giới chuyên gia bảo mật đã vào cuộc phân tích và đưa ra những nhận định trái chiều về mức độ nguy hiểm thực sự của công cụ này.

Những tuyên bố gây sốc về khả năng của Anthropic Mythos​

1776046670354.png


Theo các tài liệu do Anthropic công bố, mô hình Mythos được giới thiệu là một công cụ có năng lực vượt trội trong việc rà quét và phát hiện các lỗ hổng bảo mật nghiêm trọng trong phần mềm. Công ty khẳng định hệ thống này đã tìm thấy "hàng nghìn lỗ hổng" trên nhiều nền tảng phổ biến hiện nay, bao gồm hệ điều hành, trình duyệt web và các dự án mã nguồn mở.

Chính vì mức độ hiệu quả được cho là quá lớn, Anthropic tuyên bố họ phải hạn chế quyền truy cập, chỉ giữ lại sử dụng nội bộ hoặc hợp tác hạn chế với các chính phủ và tập đoàn công nghệ lớn để kiểm soát rủi ro. Những thông tin này nhanh chóng tạo nên hình ảnh về một "siêu hacker" AI có thể gây ra những cuộc tấn công mạng trên diện rộng nếu rơi vào tay kẻ xấu.

Phân tích dữ liệu thực tế: Con số và những điểm mâu thuẫn​

Khi đi sâu vào phân tích các báo cáo kỹ thuật, giới chuyên gia nhận thấy có sự chênh lệch đáng kể giữa tuyên bố truyền thông và dữ liệu thực nghiệm. Con số "hàng nghìn lỗ hổng" thực tế không phải là kết quả kiểm chứng trực tiếp trên toàn bộ hệ thống. Thay vào đó, Anthropic dựa trên một tập mẫu gồm 198 báo cáo được đánh giá thủ công, trong đó các chuyên gia đồng ý với AI khoảng 90% trường hợp, rồi từ đó ngoại suy ra quy mô lớn hơn. Trong một thử nghiệm thực tế trên hơn 7.000 dự án mã nguồn mở, Anthropic Mythos chỉ phát hiện được khoảng 600 trường hợp gây lỗi, và đáng chú ý là chỉ có khoảng 10 lỗ hổng được xếp vào mức độ nghiêm trọng.

Một ví dụ điển hình là lỗi tồn tại 16 năm trong FFmpeg mà Mythos phát hiện được, nhưng chính báo cáo cũng thừa nhận việc khai thác lỗi này trên thực tế là cực kỳ khó khăn. Tương tự, các lỗ hổng trong nhân Linux mà AI này tìm thấy cũng khó có thể bị lợi dụng nhờ vào các lớp bảo vệ sẵn có của hệ điều hành.

Chiến lược định vị thương hiệu và phản ứng của giới công nghệ​

Nhiều chuyên gia bảo mật cho rằng việc Anthropic nhấn mạnh tính nguy hiểm của Mythos thực chất là một chiến lược tiếp thị khôn ngoan. Bằng cách tự gắn mác "quái vật AI" quá nguy hiểm để công khai, Anthropic củng cố hình ảnh một công ty AI có trách nhiệm và ưu tiên sự an toàn, từ đó thu hút các hợp đồng lớn từ chính phủ và tổ chức quốc tế.

CEO NVIDIA Jensen Huang từng nhận định rằng việc phóng đại rủi ro AI có thể là cách để các công ty tự biến mình thành đơn vị duy nhất đủ khả năng phát triển AI an toàn. Trong khi CEO Anthropic Dario Amodei liên tục đưa ra các cảnh báo về nguy cơ an ninh, giới chuyên môn lại chỉ ra rằng Mythos vẫn chỉ là một công cụ xử lý dữ liệu hỗ trợ phát hiện lỗi, chưa phải là một hệ thống có ý thức hay khả năng tự hành động như một hacker thực thụ trong môi trường thực tế.

Kết luận​

Tổng kết lại, Anthropic Mythos đại diện cho một bước tiến đáng ghi nhận trong việc ứng dụng AI vào lĩnh vực an ninh mạng, giúp rút ngắn thời gian vá lỗi cho các nhà phát triển. Tuy nhiên, những tuyên bố về một thực thể AI nguy hiểm đến mức không thể công khai dường như mang đậm màu sắc của một chiến lược truyền thông nhằm định vị thị trường hơn là một mối đe dọa kỹ thuật hiện hữu. Việc đánh giá đúng khả năng của AI sẽ giúp cộng đồng tận dụng tốt công cụ này thay vì lo sợ những kịch bản chưa có cơ sở thực tế.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9jbGF1ZGUtbXl0aG9zLXF1YWktdmF0LWFpLW5ndXktaGllbS1oYXktY2hpLWxhLWNoaWV1LXRyby1tYXJrZXRpbmcuODE3Mzcv
Top