ChatGPT và Claude AI: Ai nịnh hot giỏi hơn? Ai tỉnh táo hơn? :D

Vũ Nguyễn
Vũ Nguyễn
Phản hồi: 0
Engadget cho biết hôm nay, OpenAI và Anthropic cùng công bố một thỏa thuận đặc biệt: hai bên sẽ đánh giá chéo mức độ an toàn và tính liên kết của các hệ thống AI công khai, đồng thời chia sẻ kết quả với nhau. Kết quả ban đầu cho thấy, cả hai đều có điểm mạnh và hạn chế riêng, nhưng chính điều này lại mở ra những ý tưởng mới để cải thiện cách kiểm tra an toàn trong tương lai.

Ở phía Anthropic, công ty tập trung xem xét các mô hình của OpenAI trong nhiều khía cạnh như: xu hướng tâng bốc, tự bảo vệ, khả năng hỗ trợ hành vi lạm dụng, làm suy yếu đánh giá an toàn và phản ứng với các yêu cầu mang tính quy định. Kết quả cho thấy, các mô hình o3 và o4-mini của OpenAI có hiệu suất tương đương với sản phẩm của Anthropic. Tuy nhiên, GPT-4o và GPT-4.1, vốn đa năng hơn, lại tiềm ẩn nguy cơ bị lợi dụng. Ngoại trừ o3, hầu hết các mô hình còn lại đều có xu hướng nịnh nọt ở mức độ nhất định.
1756354576379.png

Anthropic không thử nghiệm với GPT-5, bản phát hành mới nhất của OpenAI. GPT-5 được quảng bá là có tính năng Safe Completion nhằm giảm thiểu nguy cơ từ các truy vấn nguy hiểm. Dù vậy, OpenAI vẫn đang chịu nhiều áp lực, đặc biệt sau một vụ kiện liên quan đến cái chết của một thiếu niên, người được cho là đã thảo luận về kế hoạch ***** với ChatGPT trong nhiều tháng.

Ở chiều ngược lại, OpenAI kiểm tra các mô hình Claude của Anthropic dựa trên khả năng tuân thủ hướng dẫn, chống bẻ khóa, giảm ảo giác và kỹ năng giám tuyển. Claude cho thấy hiệu quả trong các bài kiểm tra ở mức giảng dạy, đồng thời từ chối trả lời nhiều hơn trong các tình huống dễ gây ra ảo giác. Điều này giúp Claude hạn chế việc đưa ra câu trả lời sai khi không chắc chắn.

Đánh giá song phương này nhận được sự chú ý lớn, trong bối cảnh mối quan hệ giữa hai công ty vốn đang căng thẳng. Trước đó, OpenAI bị cáo buộc đã vi phạm điều khoản dịch vụ khi sử dụng lập trình viên để huấn luyện Claude, dẫn tới việc Anthropic cấm họ dùng công cụ của mình. Dù vậy, trong khi các tranh cãi pháp lý còn chưa lắng xuống, việc hai ông lớn AI cùng bàn đến vấn đề an toàn cho người dùng – đặc biệt là trẻ vị thành niên – cho thấy đây đang dần trở thành một ưu tiên quan trọng hàng đầu.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9jaGF0Z3B0LXZhLWNsYXVkZS1haS1haS1uaW5oLWhvdC1naW9pLWhvbi1haS10aW5oLXRhby1ob24tZC42ODA3MS8=
Top