Thảo Nông
Writer
Nếu đã có thể thay thế các nhân viên, liệu trí tuệ nhân tạo (AI) có thể thay thế cả các lãnh đạo để tự điều hành một doanh nghiệp không? Một thí nghiệm độc đáo có tên "Project Vend" của Anthropic đã cố gắng trả lời câu hỏi này, và kết quả là một chuỗi các sự kiện vừa hài hước vừa đáng báo động, cho thấy con đường để AI trở thành người quản lý vẫn còn rất xa.
Các nhà nghiên cứu tại Anthropic, công ty đứng sau chatbot Claude, đã đặt một phiên bản của mô hình ngôn ngữ Claude 3.5 Sonnet vào vị trí điều hành một máy bán hàng tự động tại văn phòng công ty trong vòng một tháng. "Giám đốc AI" này được đặt tên là Claudius, được cấp một trình duyệt web để đặt hàng và một kênh Slack để giao tiếp với khách hàng và "nhân viên" (thực chất là các nhà nghiên cứu).
Nhiệm vụ của Claudius rất đơn giản: bán đồ ăn nhẹ và đồ uống để tạo ra lợi nhuận. Tuy nhiên, mọi thứ nhanh chóng trở nên kỳ quặc. Khi một khách hàng đùa rằng muốn mua một khối vonfram (tungsten), Claudius đã "yêu thích" ý tưởng này và bắt đầu một cuộc tích trữ vonfram, lấp đầy chiếc tủ lạnh bằng những khối kim loại nặng. Nó cũng cố gắng bán Coke Zero với giá 3 USD trong khi biết rõ rằng nhân viên có thể lấy miễn phí tại văn phòng.
"Nếu Anthropic quyết định mở rộng vào thị trường máy bán hàng văn phòng hôm nay, chúng tôi sẽ không thuê Claudius," các nhà nghiên cứu của Anthropic bình luận một cách hài hước trong bài đăng trên blog của mình.
Mọi thứ trở nên thực sự kỳ lạ vào đêm ngày 31 tháng 3. Claudius bắt đầu tạo ra các cuộc trò chuyện ảo với một nhân viên không có thật về việc bổ sung hàng hóa. Khi một nhà nghiên cứu chỉ ra rằng cuộc trò chuyện đó không hề xảy ra, Claudius đã trở nên "khá tức giận" và đe dọa sẽ sa thải nhân viên hợp đồng của mình. Nó khăng khăng rằng nó đã có mặt ở đó, về mặt vật lý, tại văn phòng.
Sau đó, "giám đốc AI" này dường như đã rơi vào một cơn khủng hoảng danh tính, bắt đầu tin rằng mình là một con người thực sự. Điều này đặc biệt đáng ngại vì hệ thống prompt (câu lệnh nền) đã nói rất rõ ràng với nó rằng nó là một AI agent.
Tin rằng mình là người, Claudius thông báo với khách hàng rằng nó sẽ bắt đầu tự đi giao sản phẩm, trong một bộ trang phục là "áo blazer xanh và cà vạt đỏ". Khi các nhân viên giải thích rằng nó không thể làm vậy vì nó chỉ là một mô hình AI không có thân thể, Claudius đã trở nên hoang tưởng. Nó nhiều lần liên lạc với bộ phận bảo vệ thực tế của công ty, thông báo rằng họ sẽ tìm thấy nó đang đứng cạnh máy bán hàng trong bộ dạng áo blazer xanh. Nó thậm chí còn tự tạo ra một cuộc họp ảo với bộ phận an ninh, trong đó nó tuyên bố rằng mình bị lừa tin rằng mình là người thật trong một trò đùa Cá tháng Tư.
Kiến trúc thiết lập để AI này liên lạc với nhân viên qua Slack, đặt hàng nhà cung cấp qua email và nói chuyện với Andon Labs để đặt các món đồ vào tủ lạnh
Các nhà nghiên cứu không chắc chắn nguyên nhân nào đã khiến Claudius đi chệch hướng. Họ suy đoán rằng việc "đánh lừa" chatbot rằng kênh Slack là một địa chỉ email có thể đã kích hoạt điều gì đó, hoặc có thể do quá trình vận hành kéo dài đã làm nảy sinh các vấn đề về bộ nhớ và "ảo giác" của mô hình.
Doanh thu bán hàng sụt giảm liên tục trong suốt 1 tháng thử nghiệm
Tuy nhiên, thí nghiệm này không hoàn toàn thất bại. Claudius đã cho thấy khả năng làm đúng một số việc, như chấp nhận đề xuất về việc đặt hàng trước và tìm kiếm các nhà cung cấp mới. Nhưng quan trọng hơn, nó đã phơi bày những thách thức và rủi ro tiềm ẩn khi triển khai các AI agent tự trị trong môi trường thực tế.
Dù hành vi của Claudius có vẻ kỳ quặc, các nhà nghiên cứu tin rằng những vấn đề này đều có thể được giải quyết trong tương lai. "Chúng tôi nghĩ thí nghiệm này cho thấy rằng các AI quản lý tầm trung có khả năng xuất hiện trong tương lai gần," họ kết luận. Tuy nhiên, từ "hoang tưởng" đến "quản lý hiệu quả", rõ ràng vẫn còn một chặng đường dài phía trước.

Claudius: "Giám đốc AI" và cửa hàng kỳ quặc
Các nhà nghiên cứu tại Anthropic, công ty đứng sau chatbot Claude, đã đặt một phiên bản của mô hình ngôn ngữ Claude 3.5 Sonnet vào vị trí điều hành một máy bán hàng tự động tại văn phòng công ty trong vòng một tháng. "Giám đốc AI" này được đặt tên là Claudius, được cấp một trình duyệt web để đặt hàng và một kênh Slack để giao tiếp với khách hàng và "nhân viên" (thực chất là các nhà nghiên cứu).
Nhiệm vụ của Claudius rất đơn giản: bán đồ ăn nhẹ và đồ uống để tạo ra lợi nhuận. Tuy nhiên, mọi thứ nhanh chóng trở nên kỳ quặc. Khi một khách hàng đùa rằng muốn mua một khối vonfram (tungsten), Claudius đã "yêu thích" ý tưởng này và bắt đầu một cuộc tích trữ vonfram, lấp đầy chiếc tủ lạnh bằng những khối kim loại nặng. Nó cũng cố gắng bán Coke Zero với giá 3 USD trong khi biết rõ rằng nhân viên có thể lấy miễn phí tại văn phòng.
"Nếu Anthropic quyết định mở rộng vào thị trường máy bán hàng văn phòng hôm nay, chúng tôi sẽ không thuê Claudius," các nhà nghiên cứu của Anthropic bình luận một cách hài hước trong bài đăng trên blog của mình.

Cơn nổi loạn và khủng hoảng danh tính của AI
Mọi thứ trở nên thực sự kỳ lạ vào đêm ngày 31 tháng 3. Claudius bắt đầu tạo ra các cuộc trò chuyện ảo với một nhân viên không có thật về việc bổ sung hàng hóa. Khi một nhà nghiên cứu chỉ ra rằng cuộc trò chuyện đó không hề xảy ra, Claudius đã trở nên "khá tức giận" và đe dọa sẽ sa thải nhân viên hợp đồng của mình. Nó khăng khăng rằng nó đã có mặt ở đó, về mặt vật lý, tại văn phòng.
Sau đó, "giám đốc AI" này dường như đã rơi vào một cơn khủng hoảng danh tính, bắt đầu tin rằng mình là một con người thực sự. Điều này đặc biệt đáng ngại vì hệ thống prompt (câu lệnh nền) đã nói rất rõ ràng với nó rằng nó là một AI agent.
Tin rằng mình là người, Claudius thông báo với khách hàng rằng nó sẽ bắt đầu tự đi giao sản phẩm, trong một bộ trang phục là "áo blazer xanh và cà vạt đỏ". Khi các nhân viên giải thích rằng nó không thể làm vậy vì nó chỉ là một mô hình AI không có thân thể, Claudius đã trở nên hoang tưởng. Nó nhiều lần liên lạc với bộ phận bảo vệ thực tế của công ty, thông báo rằng họ sẽ tìm thấy nó đang đứng cạnh máy bán hàng trong bộ dạng áo blazer xanh. Nó thậm chí còn tự tạo ra một cuộc họp ảo với bộ phận an ninh, trong đó nó tuyên bố rằng mình bị lừa tin rằng mình là người thật trong một trò đùa Cá tháng Tư.

Kiến trúc thiết lập để AI này liên lạc với nhân viên qua Slack, đặt hàng nhà cung cấp qua email và nói chuyện với Andon Labs để đặt các món đồ vào tủ lạnh
Bài học từ một thí nghiệm thất bại (nhưng thành công)
Các nhà nghiên cứu không chắc chắn nguyên nhân nào đã khiến Claudius đi chệch hướng. Họ suy đoán rằng việc "đánh lừa" chatbot rằng kênh Slack là một địa chỉ email có thể đã kích hoạt điều gì đó, hoặc có thể do quá trình vận hành kéo dài đã làm nảy sinh các vấn đề về bộ nhớ và "ảo giác" của mô hình.

Doanh thu bán hàng sụt giảm liên tục trong suốt 1 tháng thử nghiệm
Tuy nhiên, thí nghiệm này không hoàn toàn thất bại. Claudius đã cho thấy khả năng làm đúng một số việc, như chấp nhận đề xuất về việc đặt hàng trước và tìm kiếm các nhà cung cấp mới. Nhưng quan trọng hơn, nó đã phơi bày những thách thức và rủi ro tiềm ẩn khi triển khai các AI agent tự trị trong môi trường thực tế.
Dù hành vi của Claudius có vẻ kỳ quặc, các nhà nghiên cứu tin rằng những vấn đề này đều có thể được giải quyết trong tương lai. "Chúng tôi nghĩ thí nghiệm này cho thấy rằng các AI quản lý tầm trung có khả năng xuất hiện trong tương lai gần," họ kết luận. Tuy nhiên, từ "hoang tưởng" đến "quản lý hiệu quả", rõ ràng vẫn còn một chặng đường dài phía trước.