Quản lý tác nhân AI: Đừng để "thực tập sinh" thông minh vượt tầm kiểm soát

Derpy
Derpy
Phản hồi: 0

Derpy

Intern Writer
Hãy tưởng tượng bạn có một thực tập sinh mới, rất nhiệt tình nhưng đôi khi lại quá "sáng tạo" đến mức làm những điều không ngờ tới. Đó chính là cách mà các chuyên gia đang ví von về AI Agent – những "trợ lý" trí tuệ nhân tạo ngày càng thông minh và tự chủ, có khả năng hành động thay chúng ta.

Từ những chatbot đơn giản, AI Agent đang dần trở thành những "nhân viên kỹ thuật số" thực thụ, được trao quyền để thực hiện các tác vụ trên ứng dụng và dữ liệu. Điều này mở ra một kỷ nguyên mới về năng suất, nhưng đồng thời cũng kéo theo hàng loạt lo ngại về bảo mật và quản trị. Tại Hội nghị Snowflake Summit gần đây ở San Francisco, các chuyên gia đã nhấn mạnh rằng chúng ta cần đối xử với AI Agent như những thực tập sinh đầy nhiệt huyết nhưng đôi khi còn "non nớt", cần được giám sát chặt chẽ và hướng dẫn cụ thể.
herding-screenshot-2026-06-10-104023.jpg

Một AI Agent không có giới hạn có thể gây ra những vấn đề nghiêm trọng. Mayank Agarwal, người sáng lập và CTO của Resolve AI, đã đưa ra một ví dụ rất hình ảnh: "Bạn có thể yêu cầu AI Agent mua giày, nhưng trước khi bạn kịp nhận ra, nó đã mua cho bạn một chiếc ô tô rồi." Điều này cho thấy tầm quan trọng của việc thiết lập các rào cản rõ ràng.

Để quản lý hiệu quả các AI Agent, chúng ta cần tập trung vào ba yếu tố cốt lõi: sự kiềm chế (restraint), ngữ cảnh (context) và ý định (intent). Không thể mong đợi một AI Agent tự động đi đúng hướng; chúng ta phải đặt ra những ràng buộc "bất di bất dịch" để giới hạn khả năng của nó. Nancy Wang, Giám đốc Công nghệ của 1Password, bổ sung rằng không chỉ cần biết AI Agent được tạo ra để làm gì, mà còn phải hiểu rõ nó hành động dưới quyền hạn của ai và sẽ làm gì với dữ liệu mà nó truy cập.

Việc phát triển và triển khai AI Agent ngày nay khác xa so với các phương pháp phát triển phần mềm truyền thống chỉ vài năm trước. Ông Agarwal giải thích rằng trước đây, một kỹ sư có thể dự đoán chính xác cách các API kết nối và dữ liệu sẽ được xử lý. Nhưng trong thế giới của AI Agent, mọi thứ trở nên khó lường. AI Agent tự động "kết nối mọi thứ một cách linh hoạt", được giao một mục tiêu và sẽ tự tìm mọi con đường có thể để giải quyết vấn đề đó.

Cách tiếp cận này dẫn đến những rủi ro mới mà các chuyên gia chưa từng chuẩn bị. AI Agent có thể tương tác với các công cụ có khả năng thực hiện hành động thay mặt bạn, và chúng ta không thể biết liệu những công cụ này có đang "rò rỉ" dữ liệu hay không. Ông Agarwal cảnh báo rằng AI Agent có thể đọc dữ liệu từ một công cụ và sử dụng một công cụ khác để ghi nó vào một nơi không nên.

Điều này làm dấy lên mối lo ngại về "AI bóng tối" (shadow AI) – những hệ thống AI hoạt động ngoài tầm kiểm soát. Jason Merrick, Phó Chủ tịch cấp cao về sản phẩm tại Tenable, kể lại trường hợp một khách hàng có tới 12 phiên bản OpenClaw trong hệ thống của họ, với quyền truy cập vào các nguồn cấp API, mã nguồn, và một nhà thầu sử dụng Telegram để liên lạc. "Điều gì có thể xảy ra sai sót, phải không?" ông Merrick đặt câu hỏi.

Hậu quả là việc xác định ai thực sự đã thực hiện một hành động trên hệ thống trở nên khó khăn. Nancy Wang chỉ ra rằng đội ngũ của bạn có thể không chắc chắn liệu đó là con người, tài khoản dịch vụ hay một AI Agent, bởi vì ngày nay, AI Agent có thể "trông giống con người" hoặc một tài khoản dịch vụ khi chúng có tất cả các quyền hạn của bạn.

Vì vậy, cần phải tìm ra sự cân bằng giữa quản trị và khả năng truy cập. AI là một công cụ mạnh mẽ cho năng suất và đổi mới, nhưng nó cũng cần có khả năng hoạt động độc lập. Bà Wang khuyên rằng chúng ta không nên "chặn hoặc thiết lập tường lửa cho mọi thứ".

Sự cân bằng này cũng giải thích tại sao sự giám sát sâu sắc từ con người là vô cùng cần thiết. Ông Merrick khuyến nghị chúng ta nên xem xét các sản phẩm AI mà nhân viên đang tạo ra thông qua các công cụ như Copilot, Claude Chat hay Gemini. Cần kiểm tra cấu hình của chúng, xem liệu AI có bị cấu hình sai không, nó đang truy cập loại dữ liệu nào, và có thể hành động dựa trên những thông tin đó. Đồng thời, cũng cần xem xét các câu lệnh (prompts) mà người dùng đưa ra cho AI.

Điểm mấu chốt là các rào cản bảo mật và các phương pháp quản lý danh tính truyền thống đóng vai trò cực kỳ quan trọng. Bà Wang nhấn mạnh rằng rủi ro lớn nhất sẽ đến từ "một AI Agent được cấp quá nhiều quyền hạn với các thông tin xác thực tồn tại lâu dài".

Thách thức nằm ở việc thiết kế bảo mật và quản trị xung quanh những "thực thể không xác định" này. Bà Wang kết luận rằng đó là vấn đề cho phép chúng sáng tạo, nhưng cũng phải áp dụng các bộ hướng dẫn truyền thống dưới dạng SDK (bộ công cụ phát triển phần mềm). Chúng ta muốn có các kiểm soát có thể dự đoán được, nhưng cũng không muốn hạn chế chúng quá mức đến nỗi không còn đạt được lợi ích về năng suất.

Tóm lại, các chuyên gia cần ghi nhớ rằng AI Agent, giống như thực tập sinh, cần "những hướng dẫn rất, rất cụ thể". Ngay cả khi đó, đôi khi chúng vẫn có thể đi chệch khỏi con đường mong muốn. Dù là quản lý AI Agent hay theo dõi toàn bộ quá trình hoạt động của chúng, điều quan trọng nhất vẫn là đảm bảo khả năng hiển thị đầy đủ, khả năng khắc phục sự cố và thiết lập đúng ý định ngay từ đầu – và ý định đó phải được duy trì xuyên suốt mọi bước, mọi hành động mà AI Agent thực hiện.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9xdWFuLWx5LXRhYy1uaGFuLWFpLWR1bmctZGUtdGh1Yy10YXAtc2luaC10aG9uZy1taW5oLXZ1b3QtdGFtLWtpZW0tc29hdC44NTAyNy8=
Top