Agora và OpenAI ra mắt giải pháp Realtime API, mở ra kỷ nguyên tương tác mượt mà với AI đa phương thức

Nhật Quang
Nhật Quang
Phản hồi: 0

Nhật Quang

Editor
Thành viên BQT
Với những cải tiến đột phá tích hợp vào Realtime API, bộ máy AI hội thoại của Agora đưa trải nghiệm giao tiếp và tương tác với AI tiến gần hơn tới sự tự nhiên như con người.

1757601518830.png

Agora, nền tảng nổi tiếng về AI hội thoại và công nghệ tương tác thời gian thực, chính thức công bố mở rộng hỗ trợ cho OpenAI Realtime API. Trong bối cảnh nền kinh tế số Việt Nam đang tăng trưởng mạnh, đóng góp 18,3% GDP quốc gia trong năm 2024 và dự báo cán mốc 20,5% (khoảng 52 tỷ USD) vào cuối 2025, đưa Việt Nam trở thành thị trường tiềm năng cho các công nghệ AI hội thoại tiên tiến.

Tích hợp mới của Agora với Realtime API hỗ trợ các tính năng như chào hỏi tự động, tương tác đa phương thức, tập trung chú ý có chọn lọc cùng các công cụ nâng cao khác – tất cả nhằm tạo nên trải nghiệm giao tiếp liền mạch và tự nhiên giữa người và AI.

Đây là bước tiến quan trọng trong hợp tác giữa Agora và OpenAI, khi Realtime API là mô hình ngôn ngữ đa phương thức quy mô lớn (MLLM) đầu tiên được tích hợp trực tiếp trên nền tảng Agora. Giải pháp kết hợp này giúp các nhà phát triển tạo ra AI agent tự nhiên, phản hồi nhanh nhạy và mang tính con người hơn, đồng thời giảm bớt độ phức tạp trong phát triển và khai mở nhiều khả năng tiên tiến trong tương tác thời gian thực.

“Tương tác đa phương thức theo thời gian thực chính là mảnh ghép còn thiếu để AI trở nên thật sự giống con người,” ông Tony Zhao, CEO Agora nhấn mạnh. “Việc tích hợp Realtime API là bước đột phá, mang đến cho nhà phát triển sức mạnh để tạo ra những trải nghiệm AI vượt xa mọi quy chuẩn trước đây.”

Với Conversational AI Engine, Agora tiếp tục nâng cấp trải nghiệm hội thoại AI với các tính năng đưa giao tiếp gần gũi và tự nhiên hơn:
  • Chào hỏi tự động: Khởi tạo cuộc trò chuyện một cách tự nhiên, thân thiện ngay từ ban đầu.
  • Tương tác đa phương thức: Cho phép chuyển đổi linh hoạt giữa giọng nói và văn bản trong cùng một phiên trò chuyện.
  • Nhịp hội thoại tùy chỉnh: Nhà phát triển có thể tinh chỉnh chi tiết cách AI bắt nhịp, ngắt lời và luân chuyển lượt thoại.
  • Trò chuyện không gián đoạn: Công nghệ lọc tiếng ồn độc quyền của Agora giúp loại bỏ giọng nói xen ngang, đảm bảo tính liền mạch trong giao tiếp.
Với Conversational AI Engine, các nhà phát triển dễ dàng khai thác Realtime API và mở ra thêm nhiều tính năng cho cơ hội phát triển các ứng dụng AI đa phương thức. Việc kết hợp giữa mô hình ngôn ngữ thời gian thực của OpenAI, hạ tầng SDRTN toàn cầu của Agora và bộ công cụ lập trình chuyên biệt giúp đẩy nhanh tiến độ ra mắt, đơn giản hóa quá trình phát triển và nâng cao trải nghiệm AI hội thoại cho người dùng.

Điển hình như nhà khởi nghiệp về robot Carbon Origins đã ứng dụng công nghệ này kết hợp với giao diện lập trình thời gian thực của OpenAI để điều khiển thiết bị hạng nặng mà không cần thao tác tay, qua đó cải thiện hiệu suất làm việc.

Ông Amogha Krishna Srirangarajan, CEO kiêm nhà sáng lập Carbon Origins nhận định: “Khi kết hợp Realtime API của OpenAI với công nghệ hội thoại của Agora, chúng tôi có thể điều khiển toàn bộ đội robot tự hành mà không cần thao tác tay. Công nghệ này chính là ‘bộ não’ tự động hóa các danh mục kiểm tra và quy trình phức tạp trong Constellation AI, cho phép con người tập trung vào chiến lược và điều phối, thay vì các thao tác thủ công.”

Sự tích hợp này củng cố thêm vị thế tiên phong của Agora trong lĩnh vực AI hội thoại, tương tác thời gian thực và phát triển tác nhân đa phương thức, với các ứng dụng rộng khắp từ chăm sóc khách hàng, giáo dục, game, gắn kết người hâm mộ cho đến nhiều ngành nghề khác.

Khẳng định vị thế tiên phong, Agora vừa được trao giải “Nền tảng API Truyền thông Xuất sắc nhất” tại API World Conference 2025. Giải thưởng này ghi nhận đóng góp của bộ máy trí tuệ nhân tạo hội thoại trong việc tạo điều kiện cho sự tương tác liền mạch theo thời gian thực giữa con người và hệ thống AI, đồng thời khẳng định tầm nhìn của công ty: mang lại trải nghiệm hội thoại với AI tự nhiên và phản hồi nhanh như giao tiếp trực tiếp giữa con người với con người.
 
  • 1757601443576.png
    1757601443576.png
    185.4 KB · Lượt xem: 10


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9hZ29yYS12YS1vcGVuYWktcmEtbWF0LWdpYWktcGhhcC1yZWFsdGltZS1hcGktbW8tcmEta3ktbmd1eWVuLXR1b25nLXRhYy1tdW90LW1hLXZvaS1haS1kYS1waHVvbmctdGh1Yy42OTA0MS8=
Top