Kiên trì gửi 100.000 câu lệnh, tin tặc tìm cách bắt chước Google Gemini

W
WuKong_top1
Phản hồi: 0
Các chuyên gia an ninh mạng của Google vừa cảnh báo về một hình thức tấn công mới nhắm vào các mô hình trí tuệ nhân tạo (AI) quy mô lớn, trong đó tin tặc cố gắng khai thác Gemini - mô hình ngôn ngữ AI do Google phát triển thông qua việc gửi số lượng lớn câu lệnh (prompt).

Theo báo cáo công bố giữa tháng 2, Google Threat Intelligence Group (GTIG) cho biết họ đã phát hiện một chiến dịch sử dụng hơn 100.000 câu lệnh với mục tiêu phân tích cách Gemini phản hồi, từ đó suy đoán và tái tạo lại logic hoạt động của mô hình. Cách tiếp cận này được giới chuyên môn gọi là tấn công trích xuất mô hình - Model Extraction Attack, thường dựa trên kỹ thuật “chưng cất kiến thức”.
1771820101194.png

Không giống các cuộc tấn công khai thác lỗ hổng truyền thống, phương thức này không cần xâm nhập hệ thống hay sử dụng mã độc. Thay vào đó, kẻ tấn công kiên trì tương tác với AI, thu thập phản hồi trong thời gian dài để phục vụ việc huấn luyện một mô hình “ăn theo” với chi phí thấp hơn.

Google cho biết chiến dịch trên đã bị phát hiện và chặn đứng kịp thời, đồng thời khẳng định chưa có bằng chứng cho thấy Gemini bị sao chép thành công. Tuy nhiên, sự việc cho thấy các mô hình AI hiện đại đang trở thành mục tiêu mới, không chỉ đối với tin tặc thông thường mà cả các nhóm có tổ chức và nguồn lực lớn.

Các chuyên gia nhận định, khi AI ngày càng được tích hợp sâu vào doanh nghiệp và dịch vụ công, nguy cơ bị lạm dụng hoặc khai thác gián tiếp thông qua các hình thức tấn công “phi truyền thống” như trên sẽ tiếp tục gia tăng, đòi hỏi các nhà cung cấp phải tăng cường cơ chế giám sát và bảo vệ mô hình.
Theo WhiteHat.vn
 
Được phối hợp thực hiện bởi các chuyên gia của Bkav, cộng đồng An ninh mạng Việt Nam WhiteHat và cộng đồng Khoa học công nghệ VnReview


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9raWVuLXRyaS1ndWktMTAwLTAwMC1jYXUtbGVuaC10aW4tdGFjLXRpbS1jYWNoLWJhdC1jaHVvYy1nb29nbGUtZ2VtaW5pLjc5Mzk5Lw==
Top