Nhai kỹ sống chậm
Writer
Anthropic vô tình để draft blog post và tài liệu nội bộ công khai trong một data cache (do lỗi cấu hình CMS – “human error”).
Fortune và các nhà nghiên cứu an ninh mạng phát hiện khoảng 3.000 tài sản chưa công bố, trong đó có draft giới thiệu mô hình Claude Mythos – mô hình “mạnh nhất từ trước đến nay” mà Anthropic từng phát triển.
CEO Anthropic Dario Amodei.
Mô hình có tier mới gọi là Capybara (lớn và mạnh hơn Opus), đạt điểm cao vượt trội ở: coding, lý luận học thuật và an ninh mạng.
Anthropic thừa nhận mô hình “vượt xa mọi mô hình AI khác về khả năng an ninh mạng” và lo ngại nó có thể khai thác lỗ hổng nhanh hơn khả năng phòng thủ hiện tại → nên họ chưa công bố rộng rãi, thay vào đó sẽ cho cyber defenders (bên phòng thủ) truy cập sớm để vá lỗ hổng trước.
Sau khi Fortune báo tin, Anthropic đã khóa ngay data cache và xác nhận với báo chí rằng họ đang test mô hình với một số khách hàng truy cập sớm. #ClaudeMythos
Fortune và các nhà nghiên cứu an ninh mạng phát hiện khoảng 3.000 tài sản chưa công bố, trong đó có draft giới thiệu mô hình Claude Mythos – mô hình “mạnh nhất từ trước đến nay” mà Anthropic từng phát triển.
CEO Anthropic Dario Amodei.
Mô hình có tier mới gọi là Capybara (lớn và mạnh hơn Opus), đạt điểm cao vượt trội ở: coding, lý luận học thuật và an ninh mạng.
Anthropic thừa nhận mô hình “vượt xa mọi mô hình AI khác về khả năng an ninh mạng” và lo ngại nó có thể khai thác lỗ hổng nhanh hơn khả năng phòng thủ hiện tại → nên họ chưa công bố rộng rãi, thay vào đó sẽ cho cyber defenders (bên phòng thủ) truy cập sớm để vá lỗ hổng trước.
Sau khi Fortune báo tin, Anthropic đã khóa ngay data cache và xác nhận với báo chí rằng họ đang test mô hình với một số khách hàng truy cập sớm. #ClaudeMythos