Derpy
Intern Writer
Chắc hẳn nhiều bạn đã nghe đến các công cụ trí tuệ nhân tạo (AI) như ChatGPT của OpenAI hay Gemini của Google, đúng không nào? Những công cụ này không chỉ giúp ta trong việc tư vấn tình cảm hay viết những bài văn hay ho mà còn có khả năng làm nhiều điều thú vị khác. Nhưng liệu chúng có thể giải được sudoku vào mỗi buổi sáng của bạn không? Một nhóm các nhà khoa học tại Đại học Colorado Boulder đã quyết định tìm hiểu điều này. Họ đã tạo ra gần 2.300 bài sudoku gốc, yêu cầu người chơi điền số vào lưới theo một số quy tắc nhất định và sau đó cho nhiều công cụ AI khác nhau thử sức.
Kết quả thu được là một bức tranh đa dạng. Một số mô hình AI có thể giải được các câu sudoku dễ dàng, nhưng ngay cả những mô hình tốt nhất cũng gặp khó khăn trong việc giải thích cách chúng đạt được lời giải. Thay vì cung cấp những lý do rõ ràng, AI thường đưa ra những mô tả khó hiểu, không chính xác, thậm chí là phi lý! Kết quả này khiến chúng ta phải đặt câu hỏi về độ tin cậy của thông tin do AI tạo ra, như nhận định của Maria Pacheco, một trong những tác giả nghiên cứu. Bà cho biết, “Đối với một số loại sudoku, hầu hết các LLM vẫn chưa đạt yêu cầu, đặc biệt là trong việc tạo ra những giải thích có thể sử dụng cho con người.”
Mục đích của nhóm nghiên cứu không phải là để "gian lận" trong việc giải đố, mà là muốn tìm hiểu cách mà các nền tảng AI suy nghĩ. Điều này có thể dẫn đến việc phát triển các chương trình máy tính đáng tin cậy hơn trong tương lai, như Fabio Somenzi, một trong những tác giả khác, đã chỉ ra. Ông nói: “Đố vui rất thú vị, nhưng chúng cũng chính là một mô hình thu nhỏ để nghiên cứu quá trình ra quyết định trong học máy.”
Somenzi, một người mê sudoku thực thụ, nhận thấy rằng những bài sudoku yêu cầu người chơi phải học và tuân theo một bộ quy tắc logic. Ví dụ, bạn không thể điền số 2 vào một ô trống nếu trong cùng hàng hoặc cột đó đã có số 2 rồi. Nhưng hiện nay, phần lớn các LLM đều gặp khó khăn với loại suy nghĩ này, chủ yếu là do cách chúng được huấn luyện. Để phát triển ChatGPT, các lập trình viên đã đưa vào AI gần như tất cả thông tin mà con người từng viết trên internet. Khi ChatGPT trả lời một câu hỏi, nó dự đoán câu trả lời theo cách tương tự như một bộ nhớ máy tính. "Chúng dự đoán từ tiếp theo dựa trên tất cả dữ liệu đó," Pacheco giải thích.
Nhóm nghiên cứu hiện đang tham gia vào một nỗ lực gia tăng trong lĩnh vực khoa học máy tính, nhắm đến việc kết hợp hai phong cách tư duy: bộ nhớ của một LLM với khả năng logic của não người, một hướng đi gọi là AI "neurosymbolic". Để bắt đầu, các nhà nghiên cứu tạo ra những bài sudoku có độ khó khác nhau trên một lưới 6x6 (phiên bản đơn giản hơn của các bài 9x9 thường thấy trên mạng). Họ đã thử nghiệm những bài sudoku này với nhiều mô hình AI, bao gồm phiên bản o1 của OpenAI – đại diện cho công nghệ tiên tiến nhất trong loại LLM này vào năm 2023. Mô hình o1 đã dẫn đầu với khoảng 65% các câu sudoku giải đúng.
Khi nhóm hỏi các nền tảng AI về cách chúng đạt được các câu trả lời, kết quả thực sự gây sốc. "Đôi khi, những lời giải thích của AI đã bịa ra thông tin," Ashutosh Trivedi, một trong những tác giả của nghiên cứu nói. Ví dụ, một bộ AI đã trả lời rằng “Không thể có số 2 ở đây vì trong cùng hàng đã có số 2,” nhưng thực tế không phải như vậy. Trong một trường hợp hài hước, khi các nhà nghiên cứu thảo luận với một trong những công cụ AI về cách giải sudoku, không hiểu sao nó lại đưa ra một dự báo thời tiết. “Đến lúc đó, AI đã hoàn toàn rối loạn và không còn phương hướng,” Somenzi nói.
Các nhà nghiên cứu hy vọng sẽ thiết kế một hệ thống AI có thể làm mọi thứ – từ giải các câu đố phức tạp đến việc giải thích cách thực hiện. Họ bắt đầu với một loại câu đố khác gọi là hitori, cũng giống như sudoku, đều liên quan đến một lưới số. "Mọi người thường nói về những khả năng mới nổi của AI khi chúng có thể giải quyết những vấn đề mà bạn không mong đợi," Pacheco nói. "Nhưng đồng thời, cũng không có gì ngạc nhiên khi chúng vẫn kém ở nhiều nhiệm vụ." Thông tin thêm từ nghiên cứu của Anirudh Maiya và cộng sự sẽ còn tiếp tục được cập nhật trong tương lai.
Nguồn tham khảo: techxplore
Kết quả thu được là một bức tranh đa dạng. Một số mô hình AI có thể giải được các câu sudoku dễ dàng, nhưng ngay cả những mô hình tốt nhất cũng gặp khó khăn trong việc giải thích cách chúng đạt được lời giải. Thay vì cung cấp những lý do rõ ràng, AI thường đưa ra những mô tả khó hiểu, không chính xác, thậm chí là phi lý! Kết quả này khiến chúng ta phải đặt câu hỏi về độ tin cậy của thông tin do AI tạo ra, như nhận định của Maria Pacheco, một trong những tác giả nghiên cứu. Bà cho biết, “Đối với một số loại sudoku, hầu hết các LLM vẫn chưa đạt yêu cầu, đặc biệt là trong việc tạo ra những giải thích có thể sử dụng cho con người.”

Mục đích của nhóm nghiên cứu không phải là để "gian lận" trong việc giải đố, mà là muốn tìm hiểu cách mà các nền tảng AI suy nghĩ. Điều này có thể dẫn đến việc phát triển các chương trình máy tính đáng tin cậy hơn trong tương lai, như Fabio Somenzi, một trong những tác giả khác, đã chỉ ra. Ông nói: “Đố vui rất thú vị, nhưng chúng cũng chính là một mô hình thu nhỏ để nghiên cứu quá trình ra quyết định trong học máy.”
Somenzi, một người mê sudoku thực thụ, nhận thấy rằng những bài sudoku yêu cầu người chơi phải học và tuân theo một bộ quy tắc logic. Ví dụ, bạn không thể điền số 2 vào một ô trống nếu trong cùng hàng hoặc cột đó đã có số 2 rồi. Nhưng hiện nay, phần lớn các LLM đều gặp khó khăn với loại suy nghĩ này, chủ yếu là do cách chúng được huấn luyện. Để phát triển ChatGPT, các lập trình viên đã đưa vào AI gần như tất cả thông tin mà con người từng viết trên internet. Khi ChatGPT trả lời một câu hỏi, nó dự đoán câu trả lời theo cách tương tự như một bộ nhớ máy tính. "Chúng dự đoán từ tiếp theo dựa trên tất cả dữ liệu đó," Pacheco giải thích.
Nhóm nghiên cứu hiện đang tham gia vào một nỗ lực gia tăng trong lĩnh vực khoa học máy tính, nhắm đến việc kết hợp hai phong cách tư duy: bộ nhớ của một LLM với khả năng logic của não người, một hướng đi gọi là AI "neurosymbolic". Để bắt đầu, các nhà nghiên cứu tạo ra những bài sudoku có độ khó khác nhau trên một lưới 6x6 (phiên bản đơn giản hơn của các bài 9x9 thường thấy trên mạng). Họ đã thử nghiệm những bài sudoku này với nhiều mô hình AI, bao gồm phiên bản o1 của OpenAI – đại diện cho công nghệ tiên tiến nhất trong loại LLM này vào năm 2023. Mô hình o1 đã dẫn đầu với khoảng 65% các câu sudoku giải đúng.
Khi nhóm hỏi các nền tảng AI về cách chúng đạt được các câu trả lời, kết quả thực sự gây sốc. "Đôi khi, những lời giải thích của AI đã bịa ra thông tin," Ashutosh Trivedi, một trong những tác giả của nghiên cứu nói. Ví dụ, một bộ AI đã trả lời rằng “Không thể có số 2 ở đây vì trong cùng hàng đã có số 2,” nhưng thực tế không phải như vậy. Trong một trường hợp hài hước, khi các nhà nghiên cứu thảo luận với một trong những công cụ AI về cách giải sudoku, không hiểu sao nó lại đưa ra một dự báo thời tiết. “Đến lúc đó, AI đã hoàn toàn rối loạn và không còn phương hướng,” Somenzi nói.
Các nhà nghiên cứu hy vọng sẽ thiết kế một hệ thống AI có thể làm mọi thứ – từ giải các câu đố phức tạp đến việc giải thích cách thực hiện. Họ bắt đầu với một loại câu đố khác gọi là hitori, cũng giống như sudoku, đều liên quan đến một lưới số. "Mọi người thường nói về những khả năng mới nổi của AI khi chúng có thể giải quyết những vấn đề mà bạn không mong đợi," Pacheco nói. "Nhưng đồng thời, cũng không có gì ngạc nhiên khi chúng vẫn kém ở nhiều nhiệm vụ." Thông tin thêm từ nghiên cứu của Anirudh Maiya và cộng sự sẽ còn tiếp tục được cập nhật trong tương lai.
Nguồn tham khảo: techxplore