Thanh Phong
Editor
OpenAI vừa phát hành một mô hình trọng lượng mở mới có tên GPT-OSS, có thể tải xuống miễn phí, tùy chỉnh và thậm chí chạy trên laptop.
Mô hình này có hai phiên bản: phiên bản 120 tỷ tham số và phiên bản 20 tỷ tham số. Phiên bản lớn hơn có thể chạy trên một GPU Nvidia duy nhất và hoạt động tương tự như mô hình o4-mini hiện có của OpenAI, trong khi phiên bản nhỏ hơn hoạt động tương tự như o3-mini và chỉ chạy trên 16GB bộ nhớ. Cả hai phiên bản đều được phát hành hôm 5/8 thông qua các nền tảng như Hugging Face, Databricks, Azure và AWS theo giấy phép Apache 2.0, cho phép chúng được sửa đổi rộng rãi cho mục đích thương mại.
Đây là mô hình trọng lượng mở đầu tiên của OpenAI sau hơn 6 năm, nhiều năm trước khi ChatGPT ra mắt. Cho đến đầu năm nay, CEO Sam Altman đã nêu lý do chính khiến công ty không phát hành phiên bản tiếp theo là lo ngại về an toàn. Trong khi đó, các nhà phát triển đã đổ xô đến các mô hình mở do chi phí thấp hơn và khả năng tùy chỉnh. Vào tháng 1, sau sự trỗi dậy của DeepSeek, Sam Altman cho biết OpenAI đã "đi ngược dòng lịch sử" khi không phát hành các mô hình mở của riêng mình.
Giờ đây, OpenAI đang khẳng định lại vị thế của mình với một mô hình trọng lượng mở mà họ cho biết có thể thực hiện các tác vụ suy luận, duyệt web, viết mã và vận hành các tác nhân thông qua các API hiện có của công ty. "Tôi nghĩ rằng nhiều người thực sự ngạc nhiên khi biết rằng đại đa số khách hàng của chúng tôi đã và đang sử dụng rất nhiều mô hình mở", Chris Cook, một nhà nghiên cứu của OpenAI, phát biểu trong cuộc họp báo. "Chúng tôi muốn lấp đầy khoảng trống đó và cho phép họ sử dụng công nghệ của chúng tôi trên diện rộng."
Về mặt an toàn, OpenAI cho biết GPT-OSS là mô hình được kiểm tra nghiêm ngặt nhất từ trước đến nay và đã được thử nghiệm với các công ty an toàn bên ngoài để đảm bảo nó không gây ra rủi ro trong các lĩnh vực như an ninh mạng và vũ khí sinh học. Theo thông cáo báo chí của công ty, chuỗi suy nghĩ của mô hình (quy trình hiển thị được sử dụng để đi đến câu trả lời) được hiển thị "để theo dõi hành vi sai trái, lừa dối và lạm dụng mô hình". Đầu ra của nó chỉ là văn bản và, giống như tất cả các mô hình của OpenAI, dữ liệu đào tạo của GPT-OSS không được tiết lộ.
OpenAI chưa chia sẻ các điểm chuẩn so sánh GPT-OSS với các mô hình mở khác như Llama, DeepSeek hay Gemma của Google. Cả hai biến thể của GPT-OSS đều hoạt động tương tự như các mô hình suy luận đóng của OpenAI trong các tác vụ mã hóa. "Đây là những mô hình đáng kinh ngạc", Greg Brockman, đồng sáng lập OpenAI, cho biết. "Đội ngũ đã thực sự nỗ lực với mô hình này."
OpenAI không cam kết lịch phát hành cho các phiên bản GPT-OSS trong tương lai, nhưng họ hy vọng rằng mô hình này sẽ được các nhà phát triển và công ty nhỏ hơn sử dụng, những người muốn kiểm soát nhiều hơn cách dữ liệu của họ được sử dụng. "Chúng tôi luôn tin rằng nếu bạn hạ thấp rào cản tiếp cận, thì sự đổi mới sẽ tự nhiên tăng lên", Brockman nói. "Bạn cho phép mọi người hack, sau đó họ sẽ làm những điều vô cùng bất ngờ."

Mô hình này có hai phiên bản: phiên bản 120 tỷ tham số và phiên bản 20 tỷ tham số. Phiên bản lớn hơn có thể chạy trên một GPU Nvidia duy nhất và hoạt động tương tự như mô hình o4-mini hiện có của OpenAI, trong khi phiên bản nhỏ hơn hoạt động tương tự như o3-mini và chỉ chạy trên 16GB bộ nhớ. Cả hai phiên bản đều được phát hành hôm 5/8 thông qua các nền tảng như Hugging Face, Databricks, Azure và AWS theo giấy phép Apache 2.0, cho phép chúng được sửa đổi rộng rãi cho mục đích thương mại.
Đây là mô hình trọng lượng mở đầu tiên của OpenAI sau hơn 6 năm, nhiều năm trước khi ChatGPT ra mắt. Cho đến đầu năm nay, CEO Sam Altman đã nêu lý do chính khiến công ty không phát hành phiên bản tiếp theo là lo ngại về an toàn. Trong khi đó, các nhà phát triển đã đổ xô đến các mô hình mở do chi phí thấp hơn và khả năng tùy chỉnh. Vào tháng 1, sau sự trỗi dậy của DeepSeek, Sam Altman cho biết OpenAI đã "đi ngược dòng lịch sử" khi không phát hành các mô hình mở của riêng mình.
Giờ đây, OpenAI đang khẳng định lại vị thế của mình với một mô hình trọng lượng mở mà họ cho biết có thể thực hiện các tác vụ suy luận, duyệt web, viết mã và vận hành các tác nhân thông qua các API hiện có của công ty. "Tôi nghĩ rằng nhiều người thực sự ngạc nhiên khi biết rằng đại đa số khách hàng của chúng tôi đã và đang sử dụng rất nhiều mô hình mở", Chris Cook, một nhà nghiên cứu của OpenAI, phát biểu trong cuộc họp báo. "Chúng tôi muốn lấp đầy khoảng trống đó và cho phép họ sử dụng công nghệ của chúng tôi trên diện rộng."
Về mặt an toàn, OpenAI cho biết GPT-OSS là mô hình được kiểm tra nghiêm ngặt nhất từ trước đến nay và đã được thử nghiệm với các công ty an toàn bên ngoài để đảm bảo nó không gây ra rủi ro trong các lĩnh vực như an ninh mạng và vũ khí sinh học. Theo thông cáo báo chí của công ty, chuỗi suy nghĩ của mô hình (quy trình hiển thị được sử dụng để đi đến câu trả lời) được hiển thị "để theo dõi hành vi sai trái, lừa dối và lạm dụng mô hình". Đầu ra của nó chỉ là văn bản và, giống như tất cả các mô hình của OpenAI, dữ liệu đào tạo của GPT-OSS không được tiết lộ.
OpenAI chưa chia sẻ các điểm chuẩn so sánh GPT-OSS với các mô hình mở khác như Llama, DeepSeek hay Gemma của Google. Cả hai biến thể của GPT-OSS đều hoạt động tương tự như các mô hình suy luận đóng của OpenAI trong các tác vụ mã hóa. "Đây là những mô hình đáng kinh ngạc", Greg Brockman, đồng sáng lập OpenAI, cho biết. "Đội ngũ đã thực sự nỗ lực với mô hình này."
OpenAI không cam kết lịch phát hành cho các phiên bản GPT-OSS trong tương lai, nhưng họ hy vọng rằng mô hình này sẽ được các nhà phát triển và công ty nhỏ hơn sử dụng, những người muốn kiểm soát nhiều hơn cách dữ liệu của họ được sử dụng. "Chúng tôi luôn tin rằng nếu bạn hạ thấp rào cản tiếp cận, thì sự đổi mới sẽ tự nhiên tăng lên", Brockman nói. "Bạn cho phép mọi người hack, sau đó họ sẽ làm những điều vô cùng bất ngờ."