Khi AI bắt đầu cố tình xấu đi, mối nguy hiểm thực sự bắt đầu

Hoàng Nam · 31/12/2025

Bạn có nhớ con người phản ứng như thế nào khi lần đầu tiên nhìn thấy hình ảnh AI cách đây vài năm không?

Đầu tiên, nó dựa vào việc đánh giá "giả trong nháy mắt" vi phạm ý thức vật lý thông thường, chẳng hạn như sai số ngón tay được tạo ra và biến dạng, và con người được tạo ra sẽ không bao giờ có thể ăn mì.

Khi các lỗi thông thường của AI giảm dần từng chút một, nó sẽ đi đến một "cực đoan" khác, và các bức chân dung được tạo ra có làn da quá mịn, ánh sáng quá phẳng và bố cục quá tốt, và thoạt nhìn trông giống như một bức ảnh studio ảnh đã được P vượt qua. "Điều này không giống như một phát súng của con người", chúng ta cũng có thể đưa ra cảnh giác theo chủ nghĩa kinh nghiệm về điều này.

Thoạt nhìn, nó trông rất thật, nhưng nó quá hoàn hảo và mượt mà khi kiểm tra kỹ hơn
Mô hình hình ảnh AI mới đang bắt đầu tích cực di chuyển theo hướng "gần như". Họ học cách bắt chước các kết cấu không hoàn hảo của nhiếp ảnh di động: độ tương phản thấp, làm sắc nét quá mức, sáng lên đột ngột và một chút bố cục bình thường hoặc thậm chí mờ.

Đó là, thay vì theo đuổi "bức ảnh đẹp nhất", AI cố gắng tạo ra "loại ảnh bạn sẽ chụp". Và chính những "sai sót" này đã khiến hình ảnh bỗng trở nên đáng tin cậy.

Nút thay đổi này tiết lộ một chút "nguy hiểm" hơn, vì AI đang học cách tỏ ra kém hoàn hảo hơn, giống như con người.

AI: Tôi đã cài đặt nó

Thế giới thực không bao giờ là HD, hoàn hảo, đối xứng, sạch sẽ. Chúng tôi tin rằng một bức ảnh là thật không phải vì nó trông đẹp, mà vì nó phù hợp với cách chúng ta ghi lại thực tế.

Lỗ hổng lớn nhất trong hình ảnh AI ban đầu là một "sự hoàn hảo" kỳ lạ. Mọi điểm ảnh của hình ảnh đều quá mịn, quá sáng và quá sạch, giống như bật "mài da" đến mức tối đa rồi bôi một lớp dầu và sáp, và bức chân dung giống như một bức tượng sáp, không sống động.

Lý do rất đơn giản, khi bạn nhập "bảng", AI sẽ tạo ra "kết quả đáp ứng bất kỳ tiêu chí nào", rất có thể là "hình sách giáo khoa". Hơn nữa, từ góc độ của các nguồn dữ liệu, các hình ảnh thường được dán nhãn và trích dẫn nhiều lần là loại "biểu đồ tiêu chuẩn" này và logic cốt lõi của mô hình ban đầu là "tính trung bình giá trị" trong thế giới thực, và AI sẽ gọi hàng tỷ bảng mà nó đã thấy trong cơ sở dữ liệu của nó, và sau đó lấy một giá trị trung gian, và bản đồ bảng bẩn ở nhà bị "pha loãng" dưới mức trung bình khổng lồ này.

Loại bỏ "cảm giác dầu và sáp" là chìa khóa cho chủ nghĩa chân thực hình ảnh AI|X
Và những người đào tạo các mô hình ngày nay đang dạy AI "làm hỏng".

Lấy ví dụ về sự tích hợp gần đây của Nano Banana trong Gemini. Hình ảnh mà nó tạo ra rõ ràng là quá sắc nét, với độ tương phản cao chết người, mất các chi tiết tối, và thậm chí nhiễu đặc trưng do cảm biến quá nhỏ.

Chúng ta biết rằng vì cảm biến mà điện thoại di động có thể mang theo rất nhỏ, để bù đắp cho sự thiếu hụt quang học bẩm sinh, các nhà sản xuất điện thoại di động sẽ sử dụng thuật toán tổng hợp đa khung hình để "dữ dội" tăng độ sáng của bóng và làm sắc nét các cạnh để tạo ảo giác về độ "rõ nét".

Theo thời gian, đôi mắt của chúng ta đã được các nhà sản xuất điện thoại di động thuần hóa để làm quen với "mùi của điện thoại di động", và khi AI bắt đầu bắt chước hạn chế vật lý và quang học này, nó thực sự đang bắt chước cách nhận thức của con người sau khi được thế hệ máy móc trước đó "thuần hóa".

Hình ảnh ChatGPT mới được nâng cấp của OpenAI cũng tập trung vào "cảm giác chụp thực sự" trong video quảng cáo|OpenAI

Khi hình ảnh AI ngừng cố gắng hiển thị ánh sáng và bóng tối thực sự của thế giới vật lý, và thay vào đó hiển thị "thế giới trong camera điện thoại", theo nhận xét của The Verge, điều này được gọi là "AI đã học cách khéo léo vượt qua thung lũng kỳ lạ".

Sự khác biệt giữa ảnh này và ảnh phong cảnh được chụp bằng điện thoại di động là gì? |The Verge
Ngoài ra, Sora 2 và Veo 3 bắt đầu tạo ra các video "chất lượng giám sát" sần sùi, sử dụng logic để che đậy sự hư cấu của nội dung bằng cách sử dụng sự kém cỏi của phương tiện.

Hình ảnh AI này cũng đã đánh lừa vô số cư dân mạng, với độ chân thực "chụp nhanh" và hiệu ứng chụp ảnh bắt chước điện thoại di động|Reddit

Và chiến lược "suy thoái chủ động" này không chỉ xảy ra với các mô hình tạo hình ảnh.

"Vượt qua thung lũng kỳ lạ, một cách khéo léo"

Bạn có nhận thấy chatbot cũng đã thay đổi không?

Ngay từ đầu, "giả nhân" có "trí thông minh cao và trí tuệ cảm xúc thấp" - nói trôi chảy, có tư thế trịch thượng, có thái độ lý trí và thẳng thừng, trở nên do dự, đồng cảm và tích cực phơi bày sự dễ bị tổn thương.

Lý trí hạn chế, những từ ngữ thỉnh thoảng không đạt được ý nghĩa và cảm xúc cá nhân chắc chắn được bộc lộ trong giọng điệu...... Đây là những biểu hiện của con người bình thường.

Do đó, khi một AI "cố ý" thể hiện những điều này, nó có thể rút ngắn cảm giác khoảng cách hơn là một "đối tác trò chuyện" hoàn toàn hợp lý, ổn định, khách quan và trung lập, mà phản ứng tiềm thức của chúng ta là "khá cá nhân", "Mọi chuyện đã kết thúc, nó dường như đang thực sự suy nghĩ".

Đằng sau những "bịt mắt" này là một câu hỏi then chốt, khi AI bộc lộ sự không hoàn hảo, liệu nó có phơi bày ranh giới khả năng của nó không? Hay nó đang thể hiện khả năng của chính nó? Câu trả lời có lẽ là cái sau.

Nó có đánh giá "loại kết quả nào được con người chấp nhận hơn": mong manh, do dự, mơ hồ, ồn ào? Những điều từng được coi là sai sót này đang trở thành chiến lược hiệu suất AI để giành được lòng tin của con người.

Nó giống như những sinh viên thiên tài mà chúng tôi thỉnh thoảng nghe nói về khi chúng tôi đang học.

Khi một người quyết định có thể hiện sự yếu đuối bất cứ lúc nào hay không, đó không phải là anh ta thực sự bị tấn công, mà là anh ta được sử dụng như một khả năng xã hội. Điều này cũng đúng với AI, khi nó thể hiện sự do dự, điều đó không có nghĩa là nó không biết câu trả lời, mà là nó dễ dàng mất cảnh giác hơn khi biết rằng biểu hiện này có nhiều khả năng không được bảo vệ.

AI bắt đầu hiểu rằng những đánh giá của con người về "giống con người" vốn dĩ dựa trên sự không hoàn hảo. Nguồn gốc của chủ nghĩa hiện thực không phải là các chỉ báo kỹ thuật đạt được bởi các tham số heap, mà là một tín hiệu tâm lý và phản hồi tâm lý.

Hình ảnh "điểm ảnh thấp" do AI tạo ra về "thuyết âm mưu" tấn công khủng bố Bãi biển Bondi của Úc | Nguồn: X
Hóa ra sự phán đoán của chúng ta về sự thật luôn bị giới hạn bởi con người.

Cũng giống như con người không thể nhìn thấy tia hồng ngoại và tia cực tím, và không thể nghe thấy tần số thấp dưới 20Hz, "thực tế" mà chúng ta nhận thức chỉ là một phiên bản đã bị cắt giảm bởi cả sinh lý học và tâm lý học.

Về vấn đề này, khó khăn hơn để loại bỏ những sai lầm do AI tạo ra đáp ứng kỳ vọng của con người bằng cách buộc con người phải thừa nhận những hạn chế về phán đoán chủ quan và nhận thức.

Chiến lược mới của AI để vượt qua thung lũng kỳ lạ không phải là dốc toàn lực để mô phỏng và theo đuổi không có lỗi, mà là thiết kế chính xác "sự thật" nằm ngay trong ngưỡng tin cậy của chúng ta.

Khi AI bắt đầu cố tình xấu đi, mối nguy hiểm thực sự bắt đầu

Hoàng Nam✔

Writer

Thành viên mới đăng

Điện Máy Xanh đạt doanh thu và lợi nhuận kỷ lục, sẵn sàng “lên sàn” HOSE

Vì sao Trung Quốc chính thức "khai tử" đèn LED màu xanh trên xe điện?

Chính thức khởi động DENSO Factory Hacks 2026: Sân chơi giải bài toán nhà máy thông minh cho giới trẻ Việt

Nexon công bố vòng chung kết cuộc thi AI "NYPC 2026": nhiều đội Việt Nam giành vé đến Seoul

Hàng loạt đại học lớn ở Hàn Quốc hủy điểm thi vì sinh viên dùng AI gian lận, phải quay lại thi viết tay

Miệng nói "bóng đá không phải để bán", nhưng FIFA quyết tâm bán cổ phần thương mại World Cup

Ra mắt DUV tự làm, AI tiệm cận Mỹ và IPO chip nhớ: Đột phá dồn dập nhưng vì sao cổ phiếu công nghệ Trung Quốc vẫn đỏ sàn?

El Nino đợt này có thể mạnh nhất 150 năm qua: 2027 đối mặt nguy cơ thành năm nóng kỷ lục

Đánh giá nổi bật