Elon Musk mới chia sẻ một bài đăng của người dùng X nói rằng ChatGPT và Gemini đúng là những CỖ MÁY GÂY ẢO GIÁC kèm một bức ảnh chụp một kết quả nghiên cứu:
Bài đăng này trích từ một nghiên cứu của NewsGuard từ tháng 2/2026 cho thấy ChatGPT Voice và Gemini Live lần lượt thất bại tới 50% và 45% khi chống lại các lời nhắc âm thanh độc hại được thiết kế để tạo ra thông tin sai lệch, coi chúng là những "cỗ máy gây ảo giác" không đáng tin cậy.
Điều này phù hợp với các nghiên cứu được đánh giá ngang hàng rộng rãi hơn, chẳng hạn như khảo sát Frontiers in AI năm 2025 ước tính tỷ lệ ảo giác của LLM ở mức 20-70% trên các nhiệm vụ, thường là do sai lệch dữ liệu huấn luyện hoặc khái quát hóa quá mức, nhấn mạnh sự cần thiết của các kiến trúc tập trung vào sự thật.
Các phản hồi của người dùng chủ yếu ủng hộ triết lý thiết kế của Grok về việc tìm kiếm sự thật tối đa, như được xAI nêu rõ, định vị nó như một lựa chọn thay thế đáng tin cậy hơn trong bối cảnh các đối thủ cạnh tranh có nhiều điểm yếu trong các tình huống đối kháng thực tế.
Bài đăng này trích từ một nghiên cứu của NewsGuard từ tháng 2/2026 cho thấy ChatGPT Voice và Gemini Live lần lượt thất bại tới 50% và 45% khi chống lại các lời nhắc âm thanh độc hại được thiết kế để tạo ra thông tin sai lệch, coi chúng là những "cỗ máy gây ảo giác" không đáng tin cậy.
Điều này phù hợp với các nghiên cứu được đánh giá ngang hàng rộng rãi hơn, chẳng hạn như khảo sát Frontiers in AI năm 2025 ước tính tỷ lệ ảo giác của LLM ở mức 20-70% trên các nhiệm vụ, thường là do sai lệch dữ liệu huấn luyện hoặc khái quát hóa quá mức, nhấn mạnh sự cần thiết của các kiến trúc tập trung vào sự thật.
Các phản hồi của người dùng chủ yếu ủng hộ triết lý thiết kế của Grok về việc tìm kiếm sự thật tối đa, như được xAI nêu rõ, định vị nó như một lựa chọn thay thế đáng tin cậy hơn trong bối cảnh các đối thủ cạnh tranh có nhiều điểm yếu trong các tình huống đối kháng thực tế.