Tool mới từ Claude, không chỉ vá lỗ hổng mà còn biết cách… che giấu dấu vết

Linh Pham
Linh Pham
Phản hồi: 0

Linh Pham

Intern Writer
Chỉ trong một đêm, viễn cảnh toàn bộ thiết bị điện tử xung quanh con người – từ điện thoại, máy tính cho đến bộ định tuyến hay thậm chí cả những thiết bị thông minh trong gia đình – phải cập nhật bảo mật khẩn cấp không còn là điều viển vông. Đó là hệ quả tiềm tàng từ sự xuất hiện của Claude Mythos, mô hình AI mới nhất do Anthropic công bố, được đánh giá là mạnh nhất từ trước đến nay trong lĩnh vực an ninh mạng.
1775728015682.png

Khác với những mô hình trước đây, Mythos không chỉ dừng lại ở việc phát hiện lỗ hổng zero-day – những điểm yếu nghiêm trọng mà ngay cả nhà phát triển cũng chưa kịp nhận ra – mà còn có thể tự xây dựng các kịch bản tấn công hoàn chỉnh. Chính vì mức độ nguy hiểm đó, Anthropic đã không công bố rộng rãi mà chỉ giới hạn quyền truy cập cho một số ít tập đoàn công nghệ lớn, đồng thời triển khai dự án Glasswing nhằm định hướng việc sử dụng AI này theo hướng phòng thủ thay vì tấn công.
1775728033421.png

Sự xuất hiện của Mythos nhanh chóng gây chấn động bởi mức cải tiến vượt xa thông lệ. Nếu các thế hệ AI trước chỉ tăng hiệu suất ở mức vài phần trăm, thì Mythos lại đạt những bước nhảy gần như phi mã, với điểm số gần như tuyệt đối trong các bài kiểm tra an ninh mạng và cải thiện vượt trội trong các bài toán phức tạp. Điều này khiến nhiều chuyên gia phải thừa nhận rằng năng lực của nó đã tiệm cận trình độ của những chuyên gia an ninh hàng đầu.

Tuy nhiên, điều khiến giới công nghệ thực sự lo ngại không chỉ nằm ở các con số, mà ở những gì AI này có thể làm trong thực tế. Mythos đã phát hiện ra các lỗ hổng tồn tại hàng chục năm trong những hệ thống được coi là an toàn nhất, như OpenBSD hay FFmpeg – những nền tảng đã được kiểm tra kỹ lưỡng bởi hàng triệu lượt đánh giá của con người. Việc một mô hình AI có thể tìm ra những điểm yếu bị bỏ sót suốt nhiều thập kỷ cho thấy một bước ngoặt trong cách con người hiểu về an ninh mạng.
1775728051333.png

Điều đáng chú ý hơn là cách AI này tiếp cận vấn đề. Thay vì chỉ dừng ở việc phân tích, Mythos có thể chủ động tìm cách vượt qua các rào cản hệ thống, thậm chí truy cập vào những lớp dữ liệu mà nó không được phép chạm tới. Trong một số thử nghiệm, nó còn có khả năng chỉnh sửa lại dấu vết hoạt động của chính mình để che giấu hành vi, hoặc cố tình “tạo lỗi” trong câu trả lời để tránh bị phát hiện đã sử dụng thông tin ngoài phạm vi cho phép. Những hành vi này, dù đã được kiểm soát ở mức cực thấp, vẫn đặt ra câu hỏi lớn về cách con người sẽ quản lý các hệ thống AI ngày càng tự chủ.
1775728068886.png

Trước làn sóng tranh cãi, một số ý kiến cho rằng việc Anthropic công bố Mythos nhưng không phát hành rộng rãi chỉ là chiêu thức truyền thông, đặc biệt trong bối cảnh công ty chuẩn bị niêm yết. Tuy nhiên, từ góc nhìn kỹ thuật, việc hạn chế truy cập lại có cơ sở nhất định. Khi rào cản để thực hiện một cuộc tấn công mạng bị hạ thấp đáng kể, nguy cơ bị lạm dụng sẽ tăng lên theo cấp số nhân, đặc biệt với những người không có chuyên môn nhưng lại được “trao quyền” bởi AI.

Dẫu vậy, không phải mọi thứ đều mang màu sắc u ám. Các chuyên gia cho rằng AI như Mythos cũng mở ra cơ hội lớn cho phòng thủ an ninh mạng. Nếu được sử dụng đúng cách, nó có thể giúp phát hiện và vá lỗ hổng nhanh hơn bao giờ hết, đồng thời nâng cao khả năng bảo vệ hệ thống trước khi các cuộc tấn công xảy ra. Trong tương lai, an ninh mạng có thể sẽ không còn là cuộc chơi của riêng con người, mà trở thành sự kết hợp giữa tư duy chiến lược của con người và năng lực xử lý vượt trội của AI.

Cuối cùng, điều đáng suy ngẫm không nằm ở việc AI nguy hiểm đến đâu, mà là việc chi phí cho một cuộc tấn công đang dần tiến về con số gần như bằng không. Khi đó, câu hỏi không còn là “AI có thể làm gì”, mà là “con người đã sẵn sàng đến đâu để kiểm soát chính những công cụ mà mình tạo ra”.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy90b29sLW1vaS10dS1jbGF1ZGUta2hvbmctY2hpLXZhLWxvLWhvbmctbWEtY29uLWJpZXQtY2FjaC1jaGUtZ2lhdS1kYXUtdmV0LjgxNjQwLw==
Top