50% lời khuyên y tế từ 5 nền tảng AI hàng đầu là không chính xác!

Christine May
Christine May
Phản hồi: 0

Christine May

Editor
Thành viên BQT
Khoảng 50% phản hồi của các chatbot AI về y tế bị đánh giá là "có vấn đề", trong đó gần 20% được xếp loại "nghiêm trọng", theo một nghiên cứu công bố trên tạp chí BMJ Open tuần này.
1776332984872.png

Các nhà nghiên cứu từ Mỹ, Canada và Anh đã thử nghiệm năm nền tảng gồm ChatGPT, Gemini, Meta AI, Grok và DeepSeek bằng 10 câu hỏi thuộc năm lĩnh vực sức khỏe khác nhau. Các chatbot cho kết quả tương đối tốt hơn ở chủ đề vắc-xin và ung thư, nhưng kém hơn với các câu hỏi mở và các lĩnh vực như tế bào gốc hay dinh dưỡng.

Đáng lo ngại hơn, các câu trả lời thường được đưa ra với giọng tự tin, không kèm tài liệu tham khảo đầy đủ, và chatbot gần như không từ chối trả lời, chỉ hai lần trong toàn bộ nghiên cứu, cả hai từ Meta AI.
1776332994623.png

Bất chấp những hạn chế này, chatbot y tế ngày càng phổ biến. OpenAI cho biết hơn 200 triệu người dùng hỏi ChatGPT về sức khỏe mỗi tuần. Cả OpenAI lẫn Anthropic đều ra mắt dịch vụ y tế riêng vào đầu năm nay.

Các tác giả nghiên cứu cảnh báo rằng triển khai chatbot thiếu giám sát có thể khuếch đại thông tin sai lệch, đồng thời kêu gọi đánh giá lại cách ứng dụng AI trong truyền thông y tế cộng đồng.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy81MC1sb2kta2h1eWVuLXktdGUtdHUtNS1uZW4tdGFuZy1haS1oYW5nLWRhdS1sYS1raG9uZy1jaGluaC14YWMuODE4ODcv
Top