Cùng prompt, ChatGPT hay Gemini tạo hình ảnh tốt hơn?

Tháp rơi tự do
Tháp rơi tự do
Phản hồi: 0

Tháp rơi tự do

Intern Writer
OpenAI đã quảng bá rầm rộ sự ra mắt của ChatGPT Images 2.0 như thể nó không chỉ là một bước tiến nữa trong việc tạo ảnh bằng AI. Họ coi đó như một sự thay đổi hoàn toàn về khả năng của các công cụ này. Nhưng liệu nó có thực sự tốt hơn Nano Banana 2 của Gemini hay không? Hãy cùng tìm hiểu.

Thay vì thử nghiệm một trong hai công cụ trên các gợi ý trừu tượng hoặc cảnh tưởng tượng, tác giả quyết định xem công cụ nào tốt hơn bằng cách tập trung vào một thứ thực tế hơn. Những hình ảnh được tạo ra từ đầu bởi AI rất ấn tượng, nhưng điều thú vị hơn cả là các mô hình có thể làm gì với những bức ảnh thực tế bằng cách cải thiện chúng theo những cách vẫn tạo cảm giác chân thực.

Đây là những loại chỉnh sửa mà mọi người thực sự muốn, và đó cũng là những điểm mà AI thường gặp trục trặc — khuôn mặt bắt đầu trông không tự nhiên, ánh sáng trở nên thiếu cân đối, và các cảnh trông như được ghép lại với nhau thay vì liền mạch.

Để sử dụng ChatGPT Images 2.0, bạn chỉ cần yêu cầu ChatGPT tạo ảnh. Tương tự với Nano Banana — chỉ cần yêu cầu Gemini tạo ảnh. Vì vậy, để kiểm tra chúng, tôi đã chạy cả hai công cụ AI với cùng một bộ chỉnh sửa, sử dụng cùng một bộ ảnh gốc. Dưới đây là kết quả.

Thử nghiệm chiếu sáng​

So sánh ChatGPT Images 2.0 và Nano Banana 2

Ảnh gốc ở giữa là ảnh ChatGPT Images 2.0, và ảnh phiên bản Nano Banana của Gemini ở bên phải.(Nguồn ảnh: ChatGPT/Gemini)

Bắt đầu với một bức chân dung studio cơ bản ở bên trái, sau đó yêu cầu cả hai người mẫu "thay thế phông nền bằng một công viên vào giờ vàng". Phiên bản của ChatGPT ở giữa có vẻ hơi thiếu thực tế, mặc dù ánh sáng và bóng tối khiến chiếc ghế trông như thể thực sự được đặt ngoài trời. Bạn có thể thấy ánh nắng chiếu từ một hướng, tạo ra những bóng đổ trên con đường trùng khớp với cây cối và khuôn mặt tôi. Và chiếc ghế cũng được đặt trên mặt đất với trọng lượng phù hợp, khớp với phối cảnh và kết cấu của con đường.

Phiên bản của Nano Banana 2 ở bên phải nghiêng hẳn về phong cách "giờ vàng". Màu sắc đậm hơn và thiên về màu cam, chắc chắn rất bắt mắt. Nhưng nó bắt đầu trông giống như một bức ảnh đã được chỉnh sửa theo phong cách hơn là một cảnh thật. Ánh sáng trên khuôn mặt tôi hơi quá đều so với ánh nắng mạnh ở phía sau. Khuôn mặt cũng được làm mịn để tạo thêm độ sáng, trông đẹp nhưng lại khiến nó trông kém giống một bức ảnh thật được chụp vào khoảnh khắc đó.

Người chiến thắng: ChatGPT

Thử nghiệm phong cách điện ảnh​

So sánh ChatGPT Images 2.0 và Nano Banana 2

"Làm cho bức chân dung trông điện ảnh và ấn tượng hơn." Phiên bản của ChatGPT ở bên trái và của Gemini ở bên phải.(Nguồn ảnh: ChatGPT/Gemini)

Tiếp theo, tôi muốn xem hai người mẫu diễn giải cảm xúc hơn là yêu cầu trực tiếp về bối cảnh như thế nào, vì vậy tôi yêu cầu họ làm cho bức chân dung "trông điện ảnh và kịch tính hơn".

Phiên bản của ChatGPT ở bên trái tạo cảm giác như một thiết lập studio thực thụ được nâng cấp thêm một chút. Phông nền ấm áp có vẻ mềm mại, có kết cấu giống như phông nền chụp ảnh chuyên nghiệp, và họa tiết bóng đổ trên đó tạo cảm giác như ánh sáng xuyên qua cửa sổ hoặc một tấm cờ. Không có gì bị làm quá lên, và đó chính là điều làm nên sự thành công của nó.

Phiên bản của Nano Banana 2 ở bên phải lại đi theo một hướng hoàn toàn khác. Nó đã thay đổi bức ảnh thành một chiếc máy ảnh hoàn toàn hư cấu hướng thẳng vào mặt tôi, với khung hình thu hẹp và môi trường tối hơn. Nó nghiêng về phong cách u ám hơn, gần giống như phim noir. Nó tạo ra một không gian nội thất mờ ảo với sách và ván gỗ, đó là một ý tưởng hay, nhưng nó cũng kém chân thực hơn, và nó có vẻ hơi giống hiệu ứng "thung lũng kỳ lạ" (uncanny valley).

Người chiến thắng: ChatGPT

Kiểm tra thực tế sản phẩm​

So sánh ChatGPT Images 2.0 và Nano Banana 2

"Hãy sử dụng bức ảnh chụp AirPods này và chỉnh sửa để chúng trông thật đẹp mắt khi được đặt trong bối cảnh thực tế." — ChatGPT bên trái và Gemini bên phải.(Nguồn ảnh: ChatGPT/Gemini)

Sau đó, tác giả chuyển sang một bức ảnh cơ bản về một cặp AirPods và yêu cầu hai người mẫu tạo ra một bức ảnh mang tính quảng cáo. Tôi viết, "Hãy sử dụng bức ảnh AirPods này và làm cho chúng trông thật đẹp mắt khi được đặt trong bối cảnh thực tế."

Cả hai đều chọn một bàn làm việc với cà phê và sổ tay, nhưng từ đó những điểm khác biệt bắt đầu xuất hiện.

Phiên bản của ChatGPT ở bên trái tạo cảm giác như một chiếc bàn làm việc thực sự được ai đó sử dụng. Ánh sáng hơi không đều theo hướng tích cực, với ánh nắng mặt trời chiếu qua cửa sổ và rọi vào các phần khác nhau của bề mặt với cường độ hơi khác nhau. Phản chiếu trên AirPods rất tinh tế và thực sự tương tác với các vật thể xung quanh, đặc biệt là chiếc điện thoại tối màu hơn và cây cảnh. Ngay cả vân gỗ cũng có sự biến đổi và những khuyết điểm nhỏ khiến nó trông giống như một bề mặt thật chứ không phải là bề mặt kỹ thuật số. Thêm vào đó, họ còn tạo sự đồng bộ bằng cách đặt một chiếc iPhone bên cạnh thiết bị.

Phiên bản Nano Banana 2 của Gemini ở bên phải trông giống như một bức ảnh chụp sản phẩm được trau chuốt kỹ lưỡng. Mọi thứ được sắp xếp gọn gàng, sổ tay và kính được đặt đúng vị trí, và ánh sáng rất sạch sẽ và cân bằng. Ngoài ra còn có một số hộp đựng tai nghe ngẫu nhiên ở phía sau trông không giống hộp đựng AirPod, điều này không phải là hình ảnh lý tưởng để tiếp thị một sản phẩm cụ thể.

Chính chiếc AirPods cũng là một dấu hiệu nhận biết khác. Trong hình ảnh của ChatGPT, chúng thu nhận những chi tiết nhỏ trong môi trường xung quanh, với phản chiếu và bóng đổ. Nano Banana 2 lại một lần nữa sử dụng một chiếc máy ảnh giả tưởng để tạo ra một bức ảnh trực diện gần như phi thực tế.

Người chiến thắng: ChatGPT

Kiểm tra sự thay đổi theo mùa​

So sánh ChatGPT Images 2.0 và Nano Banana 2

"Hãy chuyển sang mùa thu" — hình ảnh gốc ở bên trái, sau đó là phiên bản của ChatGPT ở giữa và của Gemini ở bên phải.(Nguồn ảnh: ChatGPT/Gemini)

Đây là một ví dụ tuyệt vời về cách cả hai công cụ xử lý các thay đổi môi trường, không chỉ là điều chỉnh màu sắc. Tôi đã sử dụng ảnh một bãi cỏ xanh mướt và yêu cầu hai công cụ "thay đổi mùa thành mùa thu".

Phiên bản của ChatGPT ở giữa không chỉ thay đổi màu sắc; nó trở nên không đồng đều, với những mảng xanh vẫn lấp ló và lá rụng rải rác một cách ngẫu nhiên. Một số khu vực được bao phủ nhiều hơn những khu vực khác, như thể gió đã thổi lá khắp sân. Cây cối chuyển sang sắc màu mùa thu một cách tự nhiên.

Phiên bản của Nano Banana 2 ở bên phải mang đến sự biến đổi sạch sẽ và đồng đều hơn. Lá cây được trải đều hơn trên bãi cỏ, nhưng không phải tất cả các cây đều đổi màu. Bãi cỏ cũng xanh hơn, gần với màu sắc mùa xuân hơn.

Người thắng cuộc: Hòa

Và người chiến thắng là...​

Điều nổi bật từ tất cả các bài kiểm tra là Nano Banana 2 thường nhanh hơn, nhưng ChatGPT Images 2.0 vẫn luôn nhỉnh hơn. Ngay cả khi tiến hành một bài kiểm tra mù với một vài người bạn, những người chỉ được cho biết một trong hai hình ảnh đã được chỉnh sửa kỹ thuật số, tất cả họ đều nhất quán chọn ChatGPT là hình ảnh mà họ cho là thật. Mặc dù mất nhiều thời gian hơn một chút, mô hình này dường như chú ý hơn đến cách ánh sáng hoạt động, cách các kết cấu tương tác và cách khuôn mặt thực sự trông như thế nào trong các điều kiện khác nhau.

Sự khác biệt không phải lúc nào cũng rõ ràng ngay từ cái nhìn đầu tiên, và Nano Banana 2 thực sự đã đủ tốt trong hầu hết các trường hợp, nhưng sự khác biệt sẽ trở nên rõ ràng hơn khi bạn dành nhiều thời gian hơn để xem ảnh.

Nano Banana 2 tạo ra những hình ảnh trông rất đẹp, nhưng ChatGPT Images 2.0 tạo ra những hình ảnh chân thực hơn.

Người chiến thắng chung cuộc: ChatGPT

Nguồn: TechRadar
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9jdW5nLXByb21wdC1jaGF0Z3B0LWhheS1nZW1pbmktdGFvLWhpbmgtYW5oLXRvdC1ob24uODIzOTkv
Top