Công nghệ deepfake giọng nói AI đạt bước đột phá: Gian lận thành công gần 100%

Vũ Nguyễn · 21:43 Hôm qua

Nếu bạn từng dùng phần mềm đổi giọng, có lẽ bạn biết rằng các công cụ này thường có độ trễ – tức là giọng nói sau khi xử lý không thể phát ra ngay lập tức. Đặc biệt, hiệu ứng càng thật thì độ trễ càng cao.

Tuy nhiên, theo báo cáo mới nhất từ công ty an ninh mạng NCC Group, công nghệ AI hiện đã đưa giả giọng nói (deepfake voice) lên một tầm cao mới: hoạt động theo thời gian thực, tức là có thể bắt chước giọng người khác ngay trong cuộc gọi, gần như không có độ trễ – và có tỷ lệ lừa đảo thành công gần 100%.

Đột phá trong công nghệ giả giọng nói thời gian thực

Công nghệ này, gọi là “deepfake vishing” (voice + phishing), sử dụng mô hình AI để học và tái tạo các đặc điểm giọng nói của người bị nhắm đến.
Chỉ cần một cú nhấp chuột trên giao diện web, kẻ vận hành có thể giả giọng người khác theo thời gian thực trong cuộc gọi.

Các nhà nghiên cứu cho biết, hệ thống này không cần máy tính quá mạnh. Thử nghiệm trên laptop có card đồ họa Nvidia RTX A1000 cho kết quả độ trễ dưới 0,5 giây, không còn hiện tượng “lag” hay âm thanh thiếu tự nhiên như trước.

Điều đáng chú ý là chỉ cần bản ghi giọng nói chất lượng thấp, AI vẫn có thể tạo ra giọng giả cực kỳ chân thực.
Khác với các công cụ cũ – phải huấn luyện vài phút và chỉ phát được giọng ghi sẵn – công nghệ mới có thể thay đổi tông giọng, tốc độ nói, cảm xúc… ngay trong lúc gọi.

Nói cách khác, ngay cả người bình thường cũng có thể dùng laptop hoặc smartphone để tạo ra giọng giả thuyết phục, khiến việc lợi dụng công nghệ này cho mục đích xấu trở nên dễ dàng hơn bao giờ hết.

Tỷ lệ lừa đảo gần như tuyệt đối

Ông Pablo Alobera, chuyên gia bảo mật của NCC Group, cho biết trong các thử nghiệm có kiểm soát, khi giả giọng thời gian thực kết hợp với giả mạo số điện thoại, hệ thống đã đánh lừa thành công gần như toàn bộ đối tượng thử nghiệm.

Theo ông, đây là một bước nhảy vọt về tốc độ và độ chân thật của công nghệ deepfake, cho phép kẻ xấu lợi dụng cả những cuộc gọi thông thường để lừa đảo tài chính hoặc thu thập thông tin.

Trong khi deepfake giọng nói đã đạt đến mức thời gian thực, thì deepfake video vẫn còn nhiều hạn chế.
Các hệ thống hiện đại như Alibaba WAN 2.2 Animate hay Google Gemini Flash 2.5 Image có thể tạo video rất thật, nhưng vẫn gặp lỗi như biểu cảm khuôn mặt không khớp, cảm xúc gượng gạo, giọng nói lệch hình ảnh.

Ông Trevor Wiseman, người sáng lập công ty an ninh AI The Circuit, cho biết ngay cả người xem bình thường cũng có thể phát hiện video giả thông qua “sự thiếu đồng bộ giữa giọng nói và biểu cảm khuôn mặt”.

Cần cơ chế xác thực mới để chống lừa đảo AI

Wiseman cảnh báo rằng deepfake không chỉ là vấn đề lý thuyết. Ông dẫn chứng một công ty từng bị lừa trong quá trình tuyển dụng – kẻ gian dùng video deepfake để đóng giả ứng viên, khiến công ty gửi nhầm laptop đến địa chỉ giả.

Điều này cho thấy cuộc gọi hay video trực tuyến không còn là bằng chứng xác thực danh tính đáng tin cậy.
Các chuyên gia cho rằng đã đến lúc cần các cơ chế xác thực mới, chẳng hạn như mã tín hiệu bí mật hoặc từ khóa định danh giữa người thật – tương tự như “mật mã” trong thể thao chuyên nghiệp.

Nếu không có biện pháp như vậy, cá nhân và tổ chức sẽ ngày càng dễ trở thành nạn nhân của các cuộc tấn công xã hội do AI điều khiển. (IEEE Spectrum và NCC Group)

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Công nghệ deepfake giọng nói AI đạt bước đột phá: Gian lận thành công gần 100%

Vũ Nguyễn

Writer

Vũ Nguyễn

ChatGPT luôn kết thúc bằng câu hỏi, tại sao như vậy?

OpenAI đang phát triển công cụ phối nhạc tự động cho video và âm thanh

Atlas - trình duyệt mới của OpenAI có gì hơn mà thách thức sự thống trị của Google ?

AI chatbots: những sai sót nghiêm trọng có thể làm tổn hại đến uy tín của tin tức

3 tính năng bạn không biết thì thiệt trên trình duyệt AI của OpenAI, Google xưa rồi

Điều gì khiến Anthropic dám chi hàng chục tỷ đô xây “nhà máy điện” cho AI?

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

iPhone năm tới sẽ được trang bị Internet vệ tinh, xịn chưa?

ChatGPT luôn kết thúc bằng câu hỏi, tại sao như vậy?

Công nghệ deepfake giọng nói AI đạt bước đột phá: Gian lận thành công gần 100%

Nhà sáng lập Amazon Bezos: Hàng triệu người có thể sống trong không gian trong vài thập kỷ tới

Đánh giá nổi bật