OpenAI ra mắt ChatGPT Images 2.0, mô hình tạo ảnh xóa nhòa ranh giới giữa thực và ảo

Mẫn Nhi
Mẫn Nhi
Phản hồi: 0

Mẫn Nhi

Admin xinh gái
OpenAI vừa chính thức công bố ChatGPT Images 2.0, một bản nâng cấp quan trọng trong công nghệ tạo hình ảnh bằng trí tuệ nhân tạo. Động thái này diễn ra sau chuỗi thành công của các mô hình trước đó vào năm 2025, nhằm mục tiêu cạnh tranh trực tiếp với dòng Gemini Nano Banana của Google, cụ thể là phiên bản Nano Banana 2 (còn gọi là Gemini 3.1 Flash Image).

1776816190821.png


Cải tiến vượt trội về độ chi tiết và hiển thị văn bản​

Trong buổi livestream ra mắt, CEO Sam Altman cùng đội ngũ OpenAI đã trình diễn khả năng của ChatGPT Images 2.0. Điểm nhấn lớn nhất là khả năng hiển thị văn bản trong ảnh một cách chính xác, khắc phục điểm yếu của các thế hệ trước. Người dùng hiện có thể tạo ra các hình ảnh phức tạp như cửa sổ hệ điều hành macOS hoặc giao diện ứng dụng với các ký tự được kết xuất rõ ràng. Mô hình mới tuân thủ chặt chẽ các chỉ dẫn, bảo tồn chi tiết yêu cầu và xử lý tốt các yếu tố nhỏ như biểu tượng (iconography), thành phần giao diện người dùng (UI) và các bố cục dày đặc. ChatGPT Images 2.0 hỗ trợ độ phân giải lên đến 2K với nhiều tỷ lệ khung hình linh hoạt, từ siêu rộng 3:1 đến siêu cao 1:3.

1776816198694.png

Thử nghiệm của người viết với prompt rất đơn giản: Tạo một hướng dẫn chi tiết cách nấu phở Hà Nội

Hai phiên bản chuyên biệt và khả năng đa ngôn ngữ​

OpenAI giới thiệu hai biến thể: ChatGPT Images 2.0 "instant" và "thinking". Trong đó, phiên bản "thinking" có khả năng tham chiếu thông tin từ web theo thời gian thực để đảm bảo tính chính xác của hình ảnh so với thực tế. Nó cũng có thể tạo ra nhiều hình ảnh khác biệt từ một câu lệnh duy nhất và tự kiểm tra lại kết quả đầu ra của chính mình. Một cải tiến đáng chú ý khác là khả năng hiểu đa ngôn ngữ mạnh mẽ hơn. Mô hình hiện đã xử lý tốt các loại văn bản không thuộc hệ chữ Latinh, bao gồm tiếng Nhật, tiếng Hàn, tiếng Trung, tiếng Hindi và tiếng Bengali.

Chính sách giá API và tính khả dụng​

Đối với các nhà phát triển, mô hình gpt-image-2 đã có mặt trên API với cấu trúc giá cụ thể: 8,00 USD cho đầu vào (input), 2,00 USD cho đầu vào được lưu bộ nhớ đệm (cached input) và 30,00 USD cho đầu ra (output). Về phía người dùng cuối, phiên bản ChatGPT Images 2.0 "instant" hiện đã sẵn sàng cho tất cả người dùng ChatGPT và Codex. Ngược lại, phiên bản "thinking" cao cấp hơn sẽ được dành riêng cho các tài khoản đăng ký gói ChatGPT Plus, Pro và Business.

Kết luận​

Với việc ra mắt ChatGPT Images 2.0, OpenAI không chỉ nâng cao tiêu chuẩn về chất lượng hình ảnh AI mà còn trực tiếp thách thức vị thế của Google trong cuộc đua công nghệ hình ảnh thế hệ mới.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9vcGVuYWktcmEtbWF0LWNoYXRncHQtaW1hZ2VzLTItMC1tby1oaW5oLXRhby1hbmgteG9hLW5ob2EtcmFuaC1naW9pLWdpdWEtdGh1Yy12YS1hby44MjA2MS8=
Top