4 sự thật về AI ai cũng nên biết

myle.vnreview
Mỹ Lệ
Phản hồi: 0
Có rất nhiều thông tin sai lệch và suy đoán về thứ mà hầu hết mọi người hiện nay gọi là AI (trí tuệ nhân tạo). Mặc dù công nghệ này đã được áp dụng rộng rãi, nhưng vẫn có một số sự thật cơ bản chưa được chú ý, chắc chắn có thể ảnh hưởng đến quan điểm của bạn về khả năng của công nghệ này và tương lai của AI.

1768201163130.png

Các mô hình ngôn ngữ lớn (LLM) hiện đại là những cỗ máy dự đoán

Thỉnh thoảng, bạn có thể nghe bạn bè hoặc đồng nghiệp nói điều gì đó như “hãy hỏi ChatGPT xem họ nghĩ gì” khi đang suy nghĩ về một câu hỏi. Mặc dù đây là một cách nói không chỉ riêng đối với AI, nhưng đó cũng là một cách đặt câu hỏi sai lầm về cơ bản.

Các mô hình ngôn ngữ lớn (LLM) hiện nay không có khả năng “suy nghĩ” hoặc áp dụng logic vào các câu hỏi bạn đặt ra. Về bản chất, chúng là những cỗ máy đoán. Câu trả lời của chúng là sản phẩm của việc khớp mẫu, một phản hồi được tạo ra dựa trên xác suất của từ nào sẽ xuất hiện tiếp theo sau lời nhắc mà bạn đã cung cấp.

Những mẫu này được “học” bằng cách đưa dữ liệu huấn luyện vào mô hình. Các sản phẩm như ChatGPT và Gemini được huấn luyện để trả lời dựa trên các văn bản mà chúng đã phân tích. Chúng không phải là những cỗ máy biết suy nghĩ, mà là những ngân hàng bộ nhớ khổng lồ có khả năng ghép nối các phản hồi dựa trên xác suất.

Các mô hình này thực sự không "hiểu" những gì bạn đang hỏi chúng, và chúng không suy luận. Chúng có thể thực hiện các phép tính và cố gắng "giải quyết" vấn đề, nhưng kết quả đầu ra không bắt nguồn từ logic. Dự đoán và hiểu biết là hai điều rất khác nhau.

Những hạn chế của phương pháp này có thể thấy ở chỗ các mô hình này vẫn có khả năng đưa ra câu trả lời sai một cách chắc chắn. Ví dụ điển hình là khi hỏi một chatbot có bao nhiêu chữ R trong từ "raspberry" (quả mâm xôi), mô hình lại đưa ra câu trả lời chứng minh rằng chữ R đó không được tính, hoặc khi hỏi về mẹo dọn dẹp và nhận được công thức tạo ra khí clo độc hại.

Các mô hình AI đã cạn kiệt dữ liệu huấn luyện chất lượng

Điều làm cho các mô hình học máy (LLM) hoạt động hiệu quả chính là dữ liệu. Các mô hình được xây dựng bởi những người thông minh, sau đó chúng được tiếp xúc với kho dữ liệu huấn luyện khổng lồ. Theo nghĩa đó, các công cụ AI hiện đại giống như thứ được phát triển chứ không phải được thiết kế. Bạn có thể đặt nền móng, nhưng dữ liệu bạn cung cấp cho mô hình sẽ ảnh hưởng rất lớn đến kết quả cuối cùng.

Đến nay, chúng ta đã cung cấp gần như mọi thứ cho các mô hình AI hiện đại. Điều này bao gồm các kho lưu trữ internet kéo dài hàng thập kỷ dưới dạng Common Crawl, mọi bài viết trên Wikipedia, bản sao kỹ thuật số của các cuốn sách đã xuất bản, mã nguồn lập trình và nội dung do người dùng tạo ra trên các trang web mạng xã hội.

Mặc dù có thể mở rộng quy mô phần cứng bằng cách xây dựng thêm các trung tâm dữ liệu (điều chắc chắn đang xảy ra), nhưng những hạn chế về dữ liệu khó vượt qua hơn. Điều này đã làm dấy lên suy đoán rằng chúng ta đang tiến gần đến giới hạn khả năng của các mô hình hiện tại.

Các công ty như Frontier Labs AI đã bắt đầu sử dụng các mô hình AI để tạo ra dữ liệu huấn luyện tổng hợp mới. Vấn đề với cách tiếp cận này tương tự như những gì bạn có thể gặp phải nếu bạn quyết định sao chép một bản sao trong thế giới thực. Nếu bạn huấn luyện một mô hình trên dữ liệu bị suy giảm một chút mỗi lần, thì cuối cùng bạn có thể gặp phải hiện tượng được gọi là “sụp đổ mô hình”.

Lập trình bằng AI không đáp ứng được kỳ vọng

1768201200423.png

Nếu bạn tìm hiểu trong một số cộng đồng chuyên sâu trên internet, bạn sẽ bắt gặp khá nhiều lời chỉ trích về lập trình bằng AI (Vibe code). Vibe code là tên gọi dành cho việc sử dụng mô hình AI để tạo ra mã phần mềm (code) mà không thực sự hiểu cách mã đó hoạt động.

Điều này không có nghĩa là không có những ứng dụng chấp nhận được của lập trình bằng AI, đặc biệt là đối với những người đam mê và những người đang học. Lập trình bằng AI có thể giúp bạn thành công trong các dự án như tự chế tạo khung ảnh E-Ink từ đầu bằng Arduino.

Việc sử dụng AI để viết mã cũng gặp phải một số vấn đề lớn. Mặc dù các mô hình ngôn ngữ lớn giúp lập trình viên viết mã nhanh hơn bằng các gợi ý, nhưng khi nói đến việc viết mã hoàn chỉnh và triển khai nó, các mô hình AI hiện đại đơn giản là chưa sẵn sàng.

Ví dụ, nếu một mô hình viết mã hoàn hảo 99% thời gian, đó là một vấn đề. Đối với một lập trình viên, một tỷ lệ mã nhỏ không hoạt động là một vấn đề nghiêm trọng cần được khắc phục. Mặc dù con người cũng mắc sai lầm, nhưng họ cũng hiểu những gì đã tạo nên sản phẩm của mình ngay từ đầu. Hiểu rõ vấn đề là điều cần thiết để tìm ra giải pháp.

Với sự giám sát phù hợp của con người, mã nguồn có thể được làm sạch và sửa chữa. Nhưng điều đó tốn thời gian và không phải lúc nào cũng khả thi nếu vấn đề nằm sâu trong nền tảng của dự án. Nó giống như việc sửa chữa móng nhà sau khi khung nhà đã được dựng lên.

Đây là lý do tại sao bạn không nên tin tưởng những quảng cáo hứa hẹn rằng bạn có thể tạo ra ứng dụng trong mơ của mình (và kiếm lợi nhuận từ nó), ngay cả khi bạn không có kinh nghiệm lập trình.

Bạn có thể đã đóng góp vào những mô hình này, theo một cách nào đó

Các công ty phát triển AI gần như chắc chắn đã đưa nội dung do bạn tạo ra vào mô hình của họ để huấn luyện chúng tốt hơn. Đó có thể là một điều gì đó vô hại như một bình luận trên diễn đàn hoặc một cập nhật trên mạng xã hội. Đó có thể là một bài đăng trên blog do bạn viết, hoặc một bài luận ở trường được đăng tải trên mạng.

Nhưng dữ liệu huấn luyện được sử dụng cho các mô hình này còn vượt xa hơn cả những từ ngữ trên màn hình. Những bức ảnh bạn đã chụp và chia sẻ trực tuyến, ngay cả khi có giấy phép cấm sử dụng thêm, rất có thể đã bị thu thập và đưa vào máy AI. Tác phẩm nghệ thuật bạn tạo ra có thể từ nhiều thập kỷ trước, hoặc âm nhạc bạn sản xuất và đã quên từ lâu, dường như cũng nằm trong tầm ngắm.

Bất kỳ mã nguồn nào bạn đã chia sẻ hoặc các dự án phần mềm mã nguồn mở mà bạn đã đóng góp cũng rất có thể đã được sử dụng làm dữ liệu huấn luyện. Nếu bạn đã xuất bản sách, chiếu phim hoặc trưng bày tác phẩm nghệ thuật, phiên bản kỹ thuật số của nó cũng có thể đã được sử dụng.

Không tin ư? Hãy tự hỏi bộ lọc Studio Ghibli của ChatGPT đã làm thế nào để có thể sao chép gần giống với nguồn tư liệu gốc của nhà làm phim hoạt hình. Bạn không hề cho phép điều này, và bạn cũng sẽ không nhận được một xu tiền bồi thường nào.

Nguồn: Howtogeek​
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top