Google ra mắt Nano Banana Pro: Công cụ tạo ảnh AI thế hệ mới với khả năng "hiểu" bối cảnh, giải quyết "nỗi đau" về văn bản trong ảnh

Khôi Nguyên
Khôi Nguyên
Phản hồi: 0
Tiếp nối màn ra mắt của Gemini 3 mới chỉ vài ngày qua, Google vừa chính thức trình làng Nano Banana Pro (hay còn gọi là Gemini 3 Pro Image), mô hình AI tạo và chỉnh sửa hình ảnh tiên tiến nhất của hãng tính đến thời điểm hiện tại. Được xây dựng trên nền tảng lập luận mạnh mẽ của Gemini 3 Pro, Nano Banana Pro không chỉ đơn thuần là tạo ra những bức ảnh đẹp, mà còn hứa hẹn mang đến một bước nhảy vọt về khả năng hiểu biết thế giới thực, độ chính xác của văn bản và mức độ kiểm soát sáng tạo chuyên nghiệp, đáp ứng nhu cầu từ người dùng phổ thông cho đến các nhà thiết kế đồ họa.

1763697693030.png

Sức mạnh của lập luận nâng cao và dữ liệu thời gian thực

Theo công bố của Google, điểm khác biệt lớn nhất của Nano Banana Pro so với các mô hình tạo ảnh trước đây nằm ở khả năng "hiểu" sâu sắc. Nhờ tận dụng năng lực lập luận của Gemini 3, mô hình này có thể nắm bắt được bối cảnh, ý đồ và các sắc thái tinh tế trong yêu cầu của người dùng.

Hơn thế nữa, Nano Banana Pro còn được kết nối trực tiếp với kho tri thức khổng lồ và cập nhật liên tục của Google Search. Điều này cho phép nó tạo ra những hình ảnh chính xác về mặt thông tin thực tế. Ví dụ, khi được yêu cầu tạo một infographic minh họa cho công thức pha trà Elaichi (trà thảo quả) hay biểu đồ thể hiện kết quả trận đấu thể thao vừa diễn ra, AI sẽ tự động truy xuất dữ liệu chính xác để đưa vào thiết kế, thay vì chỉ tạo ra những hình ảnh ngẫu nhiên, vô nghĩa.

1763697718139.png

Infographic từng bước hướng dẫn cách pha trà Elaichi (trà thảo quả) được tặng ra bằng Nano Banana Pro, thể hiện khả năng trực quan hóa công thức và thông tin đời sống

Giải quyết "nỗi đau" về văn bản trong ảnh

Một trong những hạn chế lớn nhất của các công cụ tạo ảnh AI hiện nay là khả năng xử lý văn bản (text) rất kém, thường xuyên bị lỗi font, sai chính tả hoặc sắp xếp lộn xộn. Nano Banana Pro được Google giới thiệu là giải pháp triệt để cho vấn đề này.

1763697761467.png

Kết hợp chữ và chất liệu một cách sáng tạo bằng cách lồng ghép cụm từ vào bối cảnh chặt gỗ

Theo Google, mô hình mới có khả năng hiển thị văn bản sắc nét, đúng chính tả và bố cục, từ những câu tagline ngắn gọn cho đến cả những đoạn văn bản dài trong các thiết kế áp phích. Đặc biệt, nhờ khả năng đa ngôn ngữ của Gemini, người dùng có thể tạo và dịch văn bản trực tiếp trong ảnh sang nhiều thứ tiếng khác nhau, giúp việc bản địa hóa nội dung trở nên dễ dàng hơn bao giờ hết.

1763697781324.png

Ý tưởng cho một chiến dịch đồ uống, thể hiện khả năng dịch chính xác và hiển thị đúng văn bản tiếng Anh sang tiếng Hàn của Nano Banana Pro

Khả năng sáng tạo được nâng cấp: nhất quán và phức tạp

Đối với các nhà thiết kế chuyên nghiệp, tính nhất quán là yếu tố sống còn. Nano Banana Pro cho phép người dùng kết hợp tối đa 14 hình ảnh tham khảo vào cùng một thiết kế. Đáng kinh ngạc hơn, nó có thể giữ được sự đồng nhất về ngoại hình và trang phục cho tối đa 5 nhân vật khác nhau trong cùng một bố cục phức tạp.

1763697810732.png

Nano Banana Pro có thể giữ được tính nhất quán của tối đa 14 hình ảnh đầu vào, bao gồm nhiều nhân vật khác nhau, trong một bố cục phức tạp

Điều này mở ra khả năng ứng dụng thực tế rất lớn, từ việc biến các bản phác thảo tay thành sản phẩm mẫu (mockup) hoàn chỉnh, chuyển bản vẽ kỹ thuật thành mô hình 3D, cho đến việc tạo ra các bộ ảnh thời trang hay storyboard phim với các nhân vật nhất quán xuyên suốt.

1763697836945.png

Tạo các cảnh phong cách đời sống bằng cách kết hợp nhiều yếu tố khác nhau bằng Nano Banana Pro

1763697880622.png

Tạo nên những khung cảnh siêu thực bằng cách kết hợp nhiều yếu tố đầu vào

1763697893523.png

Nano Banana Pro giữ được tính nhất quán của tối đa 5 người với độ trung thực cao

Kiểm soát chuẩn studio: ánh sáng, góc máy và độ phân giải

Không chỉ dừng lại ở việc tạo ảnh tự động, Nano Banana Pro cung cấp cho người dùng quyền kiểm soát chi tiết như trong một studio nhiếp ảnh ảo. Các tính năng chỉnh sửa cục bộ (inpainting) được cải tiến cho phép chọn và thay đổi bất kỳ chi tiết nhỏ nào trong ảnh.

1763697922944.png

Kiểm soát định dạng đầu ra của một cảnh để phù hợp với nhiều nền tảng khác nhau, bao gồm mạng xã hội hoặc in ấn

1763697939389.png

Thay đổi diện mạo và cảm giác của hình ảnh để phù hợp với nhiều nền tảng khác nhau bằng cách điều chỉnh tỷ lệ khung hình

Người dùng cũng có thể điều chỉnh ánh sáng toàn cảnh (ví dụ: chuyển từ ngày sang đêm, thay đổi hướng nắng), thay đổi góc máy, điểm lấy nét (focus point) để tạo độ sâu trường ảnh (DoF). Cuối cùng, khả năng xuất ảnh ở độ phân giải cao 2K và 4K với nhiều tỷ lệ khung hình khác nhau đảm bảo rằng các tác phẩm tạo ra có thể đáp ứng tốt cho cả nhu cầu đăng tải mạng xã hội lẫn in ấn chuyên nghiệp.

1763697963536.png

Làm tối hoặc làm sáng một phần của hình ảnh bằng cách điều chỉnh ánh sáng để tạo hiệu ứng thị giác theo ý muốn

1763697984396.png

Điều chỉnh ánh sáng và độ nét để biến đổi cảnh từ ban ngày sang ban đêm

1763697997201.png

Làm nổi bật các chi tiết trong bố cục bằng cách điều chỉnh độ sâu trường ảnh hoặc điểm lấy nét (ví dụ: lấy nét vào những bông hoa)

Tích hợp rộng rãi và các đối tượng có thể sử dụng

Nano Banana Pro hiện đang được Google tích hợp sâu vào hệ sinh thái sản phẩm của mình. Người dùng có thể chọn giữa hai phiên bản: Nano Banana bản gốc để chỉnh sửa nhanh, hoặc Nano Banana Pro để tạo ra những thiết kế phức tạp hơn với chất lượng hình ảnh cao và độ hoàn thiện tốt hơn. Các đối tượng dưới đây hiện đã có thể bắt đầu sử dụng Nano Banana Pro.
  • Người dùng phổ thông và sinh viên: Nano Banana Pro sẽ được triển khai toàn cầu trong ứng dụng Gemini khi bạn chọn “Tạo hình ảnh” với chức năng “Thinking”. Người dùng ở gói miễn phí sẽ nhận được một hạn mức sử dụng giới hạn; khi dùng hết, hệ thống sẽ tự động chuyển về mô hình Nano Banana bản gốc. Người dùng đăng ký Google AI Plus, Pro và Ultra sẽ có hạn mức cao hơn. Đối với Chế độ AI trong Search, Nano Banana Pro sẽ khả dụng tại Mỹ cho người dùng Google AI Pro và Ultra. Với NotebookLM, Nano Banana Pro cũng sẽ được cung cấp cho người dùng đăng ký trên toàn cầu.
  • Các chuyên gia: Google đang nâng cấp tính năng tạo hình ảnh trong Google Ads lên Nano Banana Pro, giúp các nhà quảng cáo trên toàn cầu có thể tạo và chỉnh sửa hình ảnh bằng những công nghệ tiên tiến nhất. Tính năng này cũng đang được triển khai cho người dùng Workspace trong Google Slides và Vids từ hôm nay.
  • Các lập trình viên và doanh nghiệp: Nano Banana Pro có thể được truy cập thông qua Gemini API and Google AI Studio, và trong Google Antigravity để tạo các bố cục và bản mô phỏng trải nghiệm người dùng (UX) giàu tính trực quan. Các doanh nghiệp có thể bắt đầu xây dựng và triển khai ở quy mô lớn ngay hôm nay thông qua Vertex AI. Tính năng này cũng sẽ sớm có mặt trong Gemini Enterprise.
  • Nhà sáng tạo nội dung: Nano Banana Pro khả dụng cho người đăng ký Google AI Ultra trong Flow, công cụ làm phim bằng AI của Google giúp các nhà sáng tạo, nhà làm phim và đội ngũ marketing có thêm độ chính xác và khả năng kiểm soát cao hơn đối với từng khung hình và cảnh quay.
Cam kết minh bạch và cách xác định hình ảnh được tạo bằng AI trong ứng dụng Gemini

Đặc biệt, để đảm bảo tính minh bạch và an toàn thông tin, Google cam kết gắn SynthID – một loại watermak kỹ thuật số ẩn – vào tất cả các hình ảnh được tạo ra bởi công cụ này. Người dùng cũng có thể sử dụng chính ứng dụng Gemini để tải ảnh lên và kiểm tra xem nó có phải là sản phẩm của Google AI hay không. Tính năng này đang bắt đầu với hình ảnh trước và sẽ sớm mở rộng sang âm thanh và video.

1763698180374.jpeg

Bên cạnh SynthID, Google cho biết sẽ duy trì ký hiệu mờ (watermark) hiển thị (biểu tượng Gemini lấp lánh) trên các hình ảnh được tạo bởi người dùng gói miễn phí và gói Google AI Pro, nhằm giúp việc nhận diện hình ảnh do Google AI tạo ra trở nên dễ dàng hơn.

Đáng chú ý, Google nói rằng hãng nhận thấy nhu cầu giao diện hình ảnh rõ ràng phục vụ cho công việc chuyên nghiệp của người dùng, hãng sẽ gỡ bỏ watermark hiển thị trên các hình được tạo bởi người dùng đăng ký gói Google AI Ultra.

Với Nano Banana Pro, Google đang cho thấy tham vọng lớn của hãng khi không chỉ tung ra một công cụ tạo ảnh mới, mà đang định hình lại quy trình sáng tạo nội dung hình ảnh, biến AI trở thành một cộng sự đắc lực, hiểu biết và đáng tin cậy cho mọi ý tưởng.

#Gemini3ProImage
#NanoBananaPro
 
  • 1763697871239.png
    1763697871239.png
    165.4 KB · Lượt xem: 85
  • 1763698164975.jpeg
    1763698164975.jpeg
    35 KB · Lượt xem: 90


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9nb29nbGUtcmEtbWF0LW5hbm8tYmFuYW5hLXByby1jb25nLWN1LXRhby1hbmgtYWktdGhlLWhlLW1vaS12b2kta2hhLW5hbmctaGlldS1ib2ktY2FuaC1naWFpLXF1eWV0LW5vaS1kYXUtdmUtdmFuLWJhbi10cm9uZy1hbmguNzQyNzkv
Top