Bộ An ninh Trung Quốc cảnh báo về "ngộ độc dữ liệu" AI

Christine May · 05/08/2025

Thông tin để tham khảo:

Trí tuệ nhân tạo (AI) đang ngày càng được ứng dụng sâu rộng vào mọi mặt của đời sống kinh tế – xã hội. Không chỉ làm thay đổi cách con người sản xuất và sinh hoạt, AI còn trở thành một lĩnh vực then chốt để phát triển bền vững và bảo đảm an ninh quốc gia. Tuy nhiên, dữ liệu dùng để huấn luyện AI lại rất đa dạng, và không ít trong số đó chứa thông tin sai lệch, nội dung bịa đặt hay quan điểm thiên vị. Điều này gây ô nhiễm cho kho dữ liệu, đặt ra nhiều thách thức mới đối với an ninh AI.

Dữ liệu là nền móng của AI
AI được xây dựng dựa trên ba yếu tố chính: thuật toán, sức mạnh tính toán và dữ liệu. Trong đó, dữ liệu là yếu tố cơ bản để huấn luyện mô hình và là nguồn lực cốt lõi giúp các ứng dụng AI vận hành hiệu quả.

Là "nguyên liệu thô" của mô hình AI: Dữ liệu khổng lồ cung cấp cho AI một kho thông tin dồi dào, giúp mô hình học được các quy luật và khuôn mẫu ẩn trong đó. Nhờ vậy, AI có thể hiểu ngôn ngữ, đưa ra quyết định thông minh và tạo ra nội dung mới. Quá trình học liên tục cũng giúp mô hình cải thiện độ chính xác và hiệu suất, từ đó thích nghi tốt hơn với nhu cầu thực tế.

Quyết định hiệu quả của mô hình: Các mô hình AI hiện đại yêu cầu dữ liệu không chỉ nhiều mà còn phải chính xác và đa dạng. Dữ liệu đầy đủ và nhất quán giúp hạn chế tình trạng hiểu sai, trong khi dữ liệu đa lĩnh vực nâng cao khả năng xử lý những tình huống phức tạp.

Thúc đẩy ứng dụng AI trong thực tế: Dữ liệu ngày càng phong phú là cơ sở để triển khai các sáng kiến như “AI+” – tích hợp AI vào nhiều ngành nghề. Điều này góp phần nâng cao năng suất, thúc đẩy đổi mới công nghệ, hiện đại hóa công nghiệp và tăng trưởng toàn diện.

Dữ liệu "bẩn" đe dọa an ninh AI
Dữ liệu chất lượng cao giúp AI hoạt động hiệu quả và đáng tin cậy. Ngược lại, khi dữ liệu bị ô nhiễm, mô hình có thể đưa ra quyết định sai, thậm chí gây ra lỗi hệ thống và các rủi ro nghiêm trọng.

Lan truyền nội dung độc hại: Việc cố tình làm sai lệch dữ liệu bằng cách thao túng, chế tạo hoặc sao chép có thể khiến mô hình học sai, giảm độ chính xác và sinh ra nội dung gây hại. Nghiên cứu cho thấy chỉ cần 0,01% văn bản sai trong dữ liệu huấn luyện cũng làm tăng 11,2% khả năng AI tạo ra nội dung độc hại. Con số này vẫn lên tới 7,2% ngay cả khi tỷ lệ văn bản sai chỉ là 0,001%.

Gây ô nhiễm "di truyền": Nội dung sai lệch do AI tạo ra, vốn đã bị ảnh hưởng bởi dữ liệu bẩn, có thể tiếp tục được sử dụng để huấn luyện các mô hình sau này. Tình trạng này gây ra “hiệu ứng ô nhiễm di sản”, khiến sai lệch ngày càng tích tụ. Hiện tại, nội dung do AI tạo ra trên Internet đã vượt xa nội dung do con người viết, dẫn đến nguy cơ tích lũy thông tin sai sự thật trong các thế hệ AI tương lai.

Gây rủi ro trong đời sống: Ô nhiễm dữ liệu có thể dẫn đến những hậu quả nghiêm trọng trong nhiều lĩnh vực. Ở thị trường tài chính, tội phạm có thể dùng AI để tạo tin giả, thao túng giá cổ phiếu. Trong lĩnh vực an ninh công cộng, thông tin sai có thể làm công chúng hoang mang, gây rối loạn xã hội. Trong y tế, dữ liệu sai lệch có thể khiến AI chẩn đoán nhầm, dẫn đến sai sót trong điều trị và ảnh hưởng đến tính mạng người bệnh.

Cần xây dựng nền tảng dữ liệu sạch và an toàn
Kiểm soát nguồn gốc dữ liệu: Cần giám sát chặt chẽ từ đầu, tuân thủ các quy định pháp luật như Luật An ninh mạng, Luật An ninh dữ liệu và Luật Bảo vệ thông tin cá nhân. Xây dựng hệ thống phân loại và bảo vệ dữ liệu theo cấp độ để ngăn ngừa ô nhiễm ngay từ gốc.

Đánh giá rủi ro và kiểm soát luồng dữ liệu: Phải đánh giá toàn diện các rủi ro liên quan đến dữ liệu AI trong suốt vòng đời – từ thu thập, lưu trữ, truyền tải đến sử dụng và sao lưu. Đồng thời, cần đẩy nhanh việc xây dựng hệ thống phân loại rủi ro, giúp nâng cao năng lực bảo mật tổng thể.

Làm sạch và quản trị dữ liệu: Dữ liệu bị ô nhiễm cần được thường xuyên rà soát và xử lý theo quy chuẩn. Cần xây dựng quy định rõ ràng dựa trên luật và tiêu chuẩn ngành, tiến tới hình thành khung quản trị dữ liệu có khả năng giám sát và mở rộng linh hoạt.

Dưới sự chỉ đạo của Ban Chấp hành Trung ương Đảng do Tổng Bí thư Tập Cận Bình làm nòng cốt, các cơ quan an ninh quốc gia sẽ tiếp tục thực hiện toàn diện quan điểm an ninh quốc gia tổng thể. Bằng cách phối hợp với các bộ ngành liên quan, Trung Quốc đang tích cực ngăn chặn rủi ro ô nhiễm dữ liệu trong lĩnh vực AI, bảo vệ sự phát triển an toàn và bền vững của trí tuệ nhân tạo theo đúng quy định pháp luật, từ đó không ngừng củng cố tuyến phòng thủ an ninh quốc gia.

Nguồn: Weibo Bộ An ninh quốc gia Trung Quốc

Bộ An ninh Trung Quốc cảnh báo về "ngộ độc dữ liệu" AI

Christine May✔

Editor

Thành viên mới đăng

Siêu sao toán học sợ AI “hủy diệt nhân loại”: vừa đoạt giải Fields đã đầu quân cho OpenAI

OpenAI vượt mốc 1 tỷ người dùng sau khi giảm giá

Nhiều người đang dùng AI để chẩn đoán sự cố ô tô

Xiaomi tiếp tục tăng giá loạt smartphone Redmi và Xiaomi

Hai “anh em” Huawei và Honor thống trị thị trường smartphone gập Trung Quốc

Đọc vị “thủ phạm” chính đằng sau cơn bão giá RAM và bộ nhớ toàn cầu

Edifier ra mắt loa kiểm âm MR4 MKII tại Việt Nam, hướng đến creator, streamer và game thủ

Tại sao Apple vẫn chưa tăng giá sản phẩm cốt lõi và bán chạy nhất của mình?

Đánh giá nổi bật