Quang Trương
Pearl
Khi AI giúp viết nhanh hơn, nhiều hơn, liệu khoa học đang tiến lên hay đang bị “ngập rác” mà chính chúng ta không kịp nhận ra?
Vấn đề không nằm ở việc AI viết tốt hay dở. Vấn đề nằm ở chỗ, sự phổ biến của AI đã dẫn đến hiện tượng sản xuất hàng loạt các sản phẩm đầu ra kém chất lượng, những văn bản được tạo ra gần như hoàn toàn bởi máy, với rất ít hoặc không có sự kiểm soát thực chất của con người. Người ta gọi chúng bằng một cái tên khá thẳng thắn, “AI slop”, tạm hiểu là rác AI.
Câu hỏi lớn đặt ra là, điều này đang làm gì với khoa học?
Một nghiên cứu quy mô lớn của các nhà khoa học từ UC Berkeley và Cornell, công bố trên tạp chí Science, đã cố gắng trả lời câu hỏi đó bằng dữ liệu, không phải bằng cảm xúc.
Nhóm nghiên cứu đã phân tích hơn một triệu bản thảo khoa học chưa qua bình duyệt, được công bố công khai trong giai đoạn 2018 đến 2024. Họ muốn biết, khi các tác giả bắt đầu sử dụng AI, điều gì thực sự thay đổi, năng suất, chất lượng, hay cách họ tiếp cận tri thức.
Kết quả đầu tiên khá rõ ràng. Khi một tác giả bắt đầu dùng AI, số lượng bài preprint họ tạo ra tăng mạnh. Tùy nền tảng, mức tăng dao động từ khoảng 36% đến gần 60% mỗi tháng. Nói cách khác, AI thực sự giúp người ta viết nhiều hơn, nhanh hơn.
Điều này đặc biệt rõ với những nhà khoa học không phải người bản ngữ tiếng Anh, trong đó có nhiều tác giả châu Á. Với nhóm này, mức tăng có thể lên tới gần 90%. Trong khi đó, các tác giả đến từ các trường đại học nói tiếng Anh, với những cái tên mang tính “da trắng”, chỉ tăng ở mức khiêm tốn hơn.
Điều này cho thấy AI đang được dùng như một công cụ hỗ trợ ngôn ngữ, giúp những người vốn gặp rào cản tiếng Anh có thể tham gia cuộc chơi học thuật dễ hơn. Ở khía cạnh này, AI rõ ràng mang lại lợi ích.
Nhưng năng suất không phải là tất cả.
Nghe có vẻ tốt, nhưng vấn đề là mối quan hệ giữa ngôn ngữ và khả năng được xuất bản đã thay đổi theo một cách rất đáng ngại.
Với các bài viết không dùng AI, ngôn ngữ càng rõ ràng, mạch lạc, có chiều sâu, thì khả năng được xuất bản càng cao. Điều này hợp lý, vì ngôn ngữ tốt thường phản ánh tư duy tốt.
Nhưng với các bài có AI hỗ trợ, mối quan hệ này lại đảo ngược. Ngôn ngữ càng phức tạp, khả năng được xuất bản càng thấp. Điều đó gợi ý rằng, trong nhiều trường hợp, sự phức tạp do AI tạo ra không phải để làm rõ ý tưởng, mà để che đi sự yếu kém của chính nghiên cứu bên dưới.
Nói thẳng ra, câu chữ bóng bẩy đang bị dùng như một lớp sơn, phủ lên những đóng góp học thuật mỏng manh. Và hệ thống bình duyệt, vốn quen đánh giá nhanh dựa trên cảm nhận ngôn ngữ, đang bắt đầu gặp khó.
Kết quả cho thấy, người dùng Bing được tiếp cận với nguồn tài liệu đa dạng hơn, bao gồm cả các nghiên cứu mới, chứ không chỉ những bài cũ, phổ biến và được trích dẫn nhiều. Điều này cho thấy lo ngại rằng tìm kiếm bằng AI sẽ chỉ lặp lại tri thức cũ là không hoàn toàn đúng.
AI, nếu dùng đúng, có thể mở rộng góc nhìn, không phải thu hẹp nó.
Vấn đề cốt lõi không nằm ở AI, mà nằm ở cách khoa học đang đánh giá chính mình. Khi ngôn ngữ phức tạp không còn là chỉ dấu đáng tin của chất lượng, việc sàng lọc nhanh dựa trên câu chữ trở nên nguy hiểm.
Trong bối cảnh số lượng bản thảo tăng vọt, trong khi thời gian và sức lực của biên tập viên, phản biện là có hạn, khoa học buộc phải thay đổi cách đánh giá. Không thể chỉ đọc lướt và tin vào sự “nghe có vẻ hay”.
Một nghịch lý đang hình thành. Để chống lại rác AI, có lẽ khoa học sẽ phải dùng chính AI, thông qua các công cụ đánh giá, phân tích phương pháp, kiểm tra lập luận, như những gì Andrew Ng và cộng sự tại Stanford đang theo đuổi.
Câu hỏi cuối cùng là, chúng ta muốn khoa học được đo bằng điều gì, vẻ ngoài của câu chữ, hay giá trị thực của tri thức? Và trong bối cảnh Việt Nam đang khuyến khích công bố quốc tế ngày càng nhiều, câu hỏi này có lẽ không hề xa lạ. (theconversation)
Khoa học đang thay đổi vì AI, nhưng không theo cách chúng ta tưởng
Trong vài năm trở lại đây, AI tạo sinh, đặc biệt là các mô hình ngôn ngữ lớn như ChatGPT, đã thay đổi mạnh mẽ cách con người viết. Điều này không chỉ diễn ra trong lớp học, nơi làm việc hay văn hóa đại chúng, mà đang lan sâu vào khoa học, nơi vốn được xem là thành trì của tư duy nghiêm cẩn.Vấn đề không nằm ở việc AI viết tốt hay dở. Vấn đề nằm ở chỗ, sự phổ biến của AI đã dẫn đến hiện tượng sản xuất hàng loạt các sản phẩm đầu ra kém chất lượng, những văn bản được tạo ra gần như hoàn toàn bởi máy, với rất ít hoặc không có sự kiểm soát thực chất của con người. Người ta gọi chúng bằng một cái tên khá thẳng thắn, “AI slop”, tạm hiểu là rác AI.
Câu hỏi lớn đặt ra là, điều này đang làm gì với khoa học?
Một nghiên cứu quy mô lớn của các nhà khoa học từ UC Berkeley và Cornell, công bố trên tạp chí Science, đã cố gắng trả lời câu hỏi đó bằng dữ liệu, không phải bằng cảm xúc.
Nhóm nghiên cứu đã phân tích hơn một triệu bản thảo khoa học chưa qua bình duyệt, được công bố công khai trong giai đoạn 2018 đến 2024. Họ muốn biết, khi các tác giả bắt đầu sử dụng AI, điều gì thực sự thay đổi, năng suất, chất lượng, hay cách họ tiếp cận tri thức.
Kết quả đầu tiên khá rõ ràng. Khi một tác giả bắt đầu dùng AI, số lượng bài preprint họ tạo ra tăng mạnh. Tùy nền tảng, mức tăng dao động từ khoảng 36% đến gần 60% mỗi tháng. Nói cách khác, AI thực sự giúp người ta viết nhiều hơn, nhanh hơn.
Điều này đặc biệt rõ với những nhà khoa học không phải người bản ngữ tiếng Anh, trong đó có nhiều tác giả châu Á. Với nhóm này, mức tăng có thể lên tới gần 90%. Trong khi đó, các tác giả đến từ các trường đại học nói tiếng Anh, với những cái tên mang tính “da trắng”, chỉ tăng ở mức khiêm tốn hơn.
Điều này cho thấy AI đang được dùng như một công cụ hỗ trợ ngôn ngữ, giúp những người vốn gặp rào cản tiếng Anh có thể tham gia cuộc chơi học thuật dễ hơn. Ở khía cạnh này, AI rõ ràng mang lại lợi ích.
Nhưng năng suất không phải là tất cả.
Khi ngôn ngữ trở thành lớp sơn che giấu chất lượng
Phần đáng lo nhất nằm ở chất lượng bài viết. Nghiên cứu cho thấy, các bài có sử dụng AI thường dùng ngôn ngữ phức tạp hơn, câu chữ trau chuốt hơn, nghe “khoa học” hơn.Nghe có vẻ tốt, nhưng vấn đề là mối quan hệ giữa ngôn ngữ và khả năng được xuất bản đã thay đổi theo một cách rất đáng ngại.
Với các bài viết không dùng AI, ngôn ngữ càng rõ ràng, mạch lạc, có chiều sâu, thì khả năng được xuất bản càng cao. Điều này hợp lý, vì ngôn ngữ tốt thường phản ánh tư duy tốt.
Nhưng với các bài có AI hỗ trợ, mối quan hệ này lại đảo ngược. Ngôn ngữ càng phức tạp, khả năng được xuất bản càng thấp. Điều đó gợi ý rằng, trong nhiều trường hợp, sự phức tạp do AI tạo ra không phải để làm rõ ý tưởng, mà để che đi sự yếu kém của chính nghiên cứu bên dưới.
Nói thẳng ra, câu chữ bóng bẩy đang bị dùng như một lớp sơn, phủ lên những đóng góp học thuật mỏng manh. Và hệ thống bình duyệt, vốn quen đánh giá nhanh dựa trên cảm nhận ngôn ngữ, đang bắt đầu gặp khó.
AI không làm nghèo tri thức, nhưng làm khó việc đánh giá
Một điểm thú vị khác của nghiên cứu là vai trò của AI trong tìm kiếm tài liệu. Khi Microsoft tích hợp AI vào Bing thông qua Bing Chat vào đầu năm 2023, các nhà nghiên cứu có cơ hội so sánh tìm kiếm truyền thống với tìm kiếm tăng cường AI.Kết quả cho thấy, người dùng Bing được tiếp cận với nguồn tài liệu đa dạng hơn, bao gồm cả các nghiên cứu mới, chứ không chỉ những bài cũ, phổ biến và được trích dẫn nhiều. Điều này cho thấy lo ngại rằng tìm kiếm bằng AI sẽ chỉ lặp lại tri thức cũ là không hoàn toàn đúng.
AI, nếu dùng đúng, có thể mở rộng góc nhìn, không phải thu hẹp nó.
Vấn đề cốt lõi không nằm ở AI, mà nằm ở cách khoa học đang đánh giá chính mình. Khi ngôn ngữ phức tạp không còn là chỉ dấu đáng tin của chất lượng, việc sàng lọc nhanh dựa trên câu chữ trở nên nguy hiểm.
Trong bối cảnh số lượng bản thảo tăng vọt, trong khi thời gian và sức lực của biên tập viên, phản biện là có hạn, khoa học buộc phải thay đổi cách đánh giá. Không thể chỉ đọc lướt và tin vào sự “nghe có vẻ hay”.
Một nghịch lý đang hình thành. Để chống lại rác AI, có lẽ khoa học sẽ phải dùng chính AI, thông qua các công cụ đánh giá, phân tích phương pháp, kiểm tra lập luận, như những gì Andrew Ng và cộng sự tại Stanford đang theo đuổi.
Câu hỏi cuối cùng là, chúng ta muốn khoa học được đo bằng điều gì, vẻ ngoài của câu chữ, hay giá trị thực của tri thức? Và trong bối cảnh Việt Nam đang khuyến khích công bố quốc tế ngày càng nhiều, câu hỏi này có lẽ không hề xa lạ. (theconversation)