ChatGPT và Claude AI: Ai nịnh hot giỏi hơn? Ai tỉnh táo hơn? :D

Vũ Nguyễn · 11:16

Engadget cho biết hôm nay, OpenAI và Anthropic cùng công bố một thỏa thuận đặc biệt: hai bên sẽ đánh giá chéo mức độ an toàn và tính liên kết của các hệ thống AI công khai, đồng thời chia sẻ kết quả với nhau. Kết quả ban đầu cho thấy, cả hai đều có điểm mạnh và hạn chế riêng, nhưng chính điều này lại mở ra những ý tưởng mới để cải thiện cách kiểm tra an toàn trong tương lai.

Ở phía Anthropic, công ty tập trung xem xét các mô hình của OpenAI trong nhiều khía cạnh như: xu hướng tâng bốc, tự bảo vệ, khả năng hỗ trợ hành vi lạm dụng, làm suy yếu đánh giá an toàn và phản ứng với các yêu cầu mang tính quy định. Kết quả cho thấy, các mô hình o3 và o4-mini của OpenAI có hiệu suất tương đương với sản phẩm của Anthropic. Tuy nhiên, GPT-4o và GPT-4.1, vốn đa năng hơn, lại tiềm ẩn nguy cơ bị lợi dụng. Ngoại trừ o3, hầu hết các mô hình còn lại đều có xu hướng nịnh nọt ở mức độ nhất định.

Anthropic không thử nghiệm với GPT-5, bản phát hành mới nhất của OpenAI. GPT-5 được quảng bá là có tính năng Safe Completion nhằm giảm thiểu nguy cơ từ các truy vấn nguy hiểm. Dù vậy, OpenAI vẫn đang chịu nhiều áp lực, đặc biệt sau một vụ kiện liên quan đến cái chết của một thiếu niên, người được cho là đã thảo luận về kế hoạch ***** với ChatGPT trong nhiều tháng.

Ở chiều ngược lại, OpenAI kiểm tra các mô hình Claude của Anthropic dựa trên khả năng tuân thủ hướng dẫn, chống bẻ khóa, giảm ảo giác và kỹ năng giám tuyển. Claude cho thấy hiệu quả trong các bài kiểm tra ở mức giảng dạy, đồng thời từ chối trả lời nhiều hơn trong các tình huống dễ gây ra ảo giác. Điều này giúp Claude hạn chế việc đưa ra câu trả lời sai khi không chắc chắn.

Đánh giá song phương này nhận được sự chú ý lớn, trong bối cảnh mối quan hệ giữa hai công ty vốn đang căng thẳng. Trước đó, OpenAI bị cáo buộc đã vi phạm điều khoản dịch vụ khi sử dụng lập trình viên để huấn luyện Claude, dẫn tới việc Anthropic cấm họ dùng công cụ của mình. Dù vậy, trong khi các tranh cãi pháp lý còn chưa lắng xuống, việc hai ông lớn AI cùng bàn đến vấn đề an toàn cho người dùng – đặc biệt là trẻ vị thành niên – cho thấy đây đang dần trở thành một ưu tiên quan trọng hàng đầu.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

ChatGPT và Claude AI: Ai nịnh hot giỏi hơn? Ai tỉnh táo hơn? :D

Vũ Nguyễn

Writer

Vũ Nguyễn

Không còn là lý thuyết: AI đang thực sự lấy đi việc làm

Cách ngăn Google Assistant nghe lén trên máy tính bảng Android

Liên Hợp Quốc thành lập hội đồng cố vấn toàn cầu về trí tuệ nhân tạo AI

Top 5 công cụ AI tạo video tốt nhất 2025

ChatGPT khát điện hơn Google bao nhiêu lần và tại sao điều đó đáng lo?

So sánh Google Gemini và Gemini Advanced: Nâng cấp có đáng đồng tiền bát gạo?

Docker vá lỗ hổng bảo mật đe dọa người dùng Windows và macOS

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Nhật Bản khánh thành nhà máy "siêu nhân" biến nước biển thành điện đầu tiên tại Châu Á

Hàng loạt khí tài công nghệ cao của Viettel được trình diễn tại triển lãm thành tựu 80 năm

iPhone 17 dự kiến sẽ phá vỡ kỷ lục tồn tại 15 năm của iPhone 4

Alibaba ra mắt công cụ phân tích dữ liệu đầu tiên

Không còn là lý thuyết: AI đang thực sự lấy đi việc làm

Keysight hoàn thành đánh giá chứng nhận PSA cấp 4 đầu tiên trên thị trường

Bên trong nhà máy tương lai giữa đời thực: 750 robot tạo ra hơn 500.000 xe điện và hybrid mỗi năm

Đánh giá nổi bật