Phạm Thanh Bình
Writer
Một nhóm nghiên cứu thuộc Trường Y Đại học Arizona vừa công bố kết quả cho thấy mô hình trí tuệ nhân tạo ChatGPT có thể tự thực hiện các phép phân tích thống kê cơ bản trong nghiên cứu y học, với độ chính xác lên tới hơn 90% nếu được hướng dẫn đúng cách.
Công trình, đăng trên tạp chí Journal of Medical Internet Research ngày 7/2, do Michael Ruta và cộng sự tại University of Arizona College of Medicine – Phoenix thực hiện. Nhóm đã đánh giá khả năng của ChatGPT trong việc xử lý và phân tích dữ liệu y tế bằng ngôn ngữ tự nhiên mà không cần người dùng viết mã lệnh hay sử dụng phần mềm thống kê chuyên dụng.
Các nhà khoa học sử dụng dữ liệu thứ cấp từ National Inpatient Sample, tập trung vào 2.740 hồ sơ bệnh nhân trong độ tuổi 41–70, từng trải qua nhồi máu cơ tim và nhồi máu não, với tổng chi phí điều trị dưới 400.000 USD. Bộ dữ liệu gồm 5 biến cơ bản: tuổi, giới tính, chủng tộc, thời gian nằm viện và chi phí điều trị.
ChatGPT được yêu cầu thực hiện hàng loạt bước phân tích thống kê phổ biến như:
- Tạo và nhóm biến (ví dụ: “Trắng” – “Không trắng”);
- Tính các thống kê mô tả (trung bình, độ lệch chuẩn, trung vị, khoảng tứ phân vị);
- Thực hiện các kiểm định: chi-square, t-test, ANOVA, Pearson, Fisher, Mann-Whitney, Kruskal-Wallis, và các phép tương quan.
Các tác giả so sánh kết quả do ChatGPT tạo ra với kết quả chuẩn từ R, Python và SAS, ba phần mềm thống kê tiêu chuẩn trong nghiên cứu khoa học.
Hiệu quả của ChatGPT thay đổi tùy thuộc vào độ rõ ràng của yêu cầu (prompt):
- Với prompt cơ bản, ChatGPT chỉ trả lời chính xác 32,5%;
- Với prompt trung cấp, độ chính xác tăng lên 81,3%;
- Với prompt nâng cao, ChatGPT đạt 92,5%, tương đương khả năng của một sinh viên y khoa năm cuối trong việc chọn phép kiểm định, diễn giải kết quả và xác định giả định thống kê.
Nhóm nghiên cứu nhận định rằng ChatGPT không thay thế được tư duy thống kê, nhưng có thể hỗ trợ mạnh mẽ cho các nhà nghiên cứu y học, đặc biệt những người không có nền tảng lập trình.
Theo tác giả Michael Ruta, kết quả này “mở ra tiềm năng ứng dụng trí tuệ nhân tạo như một công cụ đào tạo và hỗ trợ phân tích dữ liệu trong y học”, cho phép học viên sau đại học và bác sĩ trẻ tiếp cận phân tích thống kê mà không cần học sâu về phần mềm chuyên biệt.
Các nhà nghiên cứu cho rằng, khi người dùng biết đặt câu hỏi đúng và mô tả yêu cầu rõ ràng, AI có thể đóng vai trò như một trợ lý thống kê tự động, giúp rút ngắn thời gian phân tích và giảm sai sót trong bước xử lý dữ liệu.
Nghiên cứu nhấn mạnh rằng thành công của ChatGPT phụ thuộc vào chất lượng câu lệnh mà người dùng đưa ra. “Một câu hỏi tốt tạo ra một phân tích tốt. AI không thể thay thế tư duy khoa học nhưng nó có thể khuếch đại năng lực của người hiểu mình đang hỏi gì,” nhóm nghiên cứu viết.
Nguồn: Journal of Medical Internet Research, University of Arizona College of Medicine – Phoenix, 2025.
Công trình, đăng trên tạp chí Journal of Medical Internet Research ngày 7/2, do Michael Ruta và cộng sự tại University of Arizona College of Medicine – Phoenix thực hiện. Nhóm đã đánh giá khả năng của ChatGPT trong việc xử lý và phân tích dữ liệu y tế bằng ngôn ngữ tự nhiên mà không cần người dùng viết mã lệnh hay sử dụng phần mềm thống kê chuyên dụng.
Các nhà khoa học sử dụng dữ liệu thứ cấp từ National Inpatient Sample, tập trung vào 2.740 hồ sơ bệnh nhân trong độ tuổi 41–70, từng trải qua nhồi máu cơ tim và nhồi máu não, với tổng chi phí điều trị dưới 400.000 USD. Bộ dữ liệu gồm 5 biến cơ bản: tuổi, giới tính, chủng tộc, thời gian nằm viện và chi phí điều trị.
ChatGPT được yêu cầu thực hiện hàng loạt bước phân tích thống kê phổ biến như:
- Tạo và nhóm biến (ví dụ: “Trắng” – “Không trắng”);
- Tính các thống kê mô tả (trung bình, độ lệch chuẩn, trung vị, khoảng tứ phân vị);
- Thực hiện các kiểm định: chi-square, t-test, ANOVA, Pearson, Fisher, Mann-Whitney, Kruskal-Wallis, và các phép tương quan.
Các tác giả so sánh kết quả do ChatGPT tạo ra với kết quả chuẩn từ R, Python và SAS, ba phần mềm thống kê tiêu chuẩn trong nghiên cứu khoa học.
Hiệu quả của ChatGPT thay đổi tùy thuộc vào độ rõ ràng của yêu cầu (prompt):
- Với prompt cơ bản, ChatGPT chỉ trả lời chính xác 32,5%;
- Với prompt trung cấp, độ chính xác tăng lên 81,3%;
- Với prompt nâng cao, ChatGPT đạt 92,5%, tương đương khả năng của một sinh viên y khoa năm cuối trong việc chọn phép kiểm định, diễn giải kết quả và xác định giả định thống kê.
Nhóm nghiên cứu nhận định rằng ChatGPT không thay thế được tư duy thống kê, nhưng có thể hỗ trợ mạnh mẽ cho các nhà nghiên cứu y học, đặc biệt những người không có nền tảng lập trình.
Theo tác giả Michael Ruta, kết quả này “mở ra tiềm năng ứng dụng trí tuệ nhân tạo như một công cụ đào tạo và hỗ trợ phân tích dữ liệu trong y học”, cho phép học viên sau đại học và bác sĩ trẻ tiếp cận phân tích thống kê mà không cần học sâu về phần mềm chuyên biệt.
Các nhà nghiên cứu cho rằng, khi người dùng biết đặt câu hỏi đúng và mô tả yêu cầu rõ ràng, AI có thể đóng vai trò như một trợ lý thống kê tự động, giúp rút ngắn thời gian phân tích và giảm sai sót trong bước xử lý dữ liệu.
Nghiên cứu nhấn mạnh rằng thành công của ChatGPT phụ thuộc vào chất lượng câu lệnh mà người dùng đưa ra. “Một câu hỏi tốt tạo ra một phân tích tốt. AI không thể thay thế tư duy khoa học nhưng nó có thể khuếch đại năng lực của người hiểu mình đang hỏi gì,” nhóm nghiên cứu viết.
Nguồn: Journal of Medical Internet Research, University of Arizona College of Medicine – Phoenix, 2025.