Lời khuyên tạo prompt từ chính Gemini để tạo ảnh tốt hơn gấp 10 lần

Tháp rơi tự do
Tháp rơi tự do
Phản hồi: 0

Tháp rơi tự do

Intern Writer
Chỉ cần một vài điều chỉnh nhỏ đối với các lời nhắc của bạn cũng có thể tạo ra sự khác biệt lớn với hình ảnh AI.

Hình ảnh một người đàn ông lớn tuổi được tạo ra bằng trí tuệ nhân tạo.


Mình đã sử dụng Gemini, chính xác hơn là trình tạo ảnh mặc định của nó, Nano Banana , thay vì ChatGPT để tạo ảnh kể từ khi mô hình này được ra mắt. Theo kinh nghiệm của mình, gemini thường cho kết quả gần với ý muốn của mình hơn ngay từ lần thử đầu tiên. Điều đó không có nghĩa là ChatGPT tạo ảnh kém, nhưng mình thường phải tinh chỉnh các gợi ý nhiều hơn để đạt được kết quả mong muốn.

Tuy nhiên, mình thực sự chưa từng đặt câu hỏi về cách tạo prompt đúng, chỉ dùng những mô tả đơn giản, mà cốt lõi của việc tạo ra ảnh đúng ý là prompt đúng cách và chi tiết.

Hầu hết chúng ta đều bắt đầu với những điều cơ bản: chủ đề, phong cách, hành động, và có thể là địa điểm. Điều đó sẽ cho ra kết quả kiểu như:
“Một chú mèo lông xù màu cam đang chơi với quả bóng theo phong cách màu nước.”
Hình ảnh do AI tạo ra về một chú mèo màu cam đang chơi với quả bóng.

Hoàn toàn ổn, nhưng cũng khá bình thường.

Gợi ý của Gemini là nên đi sâu hơn bằng cách bổ sung thêm các hướng dẫn cụ thể. Danh sách đầy đủ bao gồm bố cục và tỷ lệ khung hình, chi tiết về máy ảnh và ánh sáng, tích hợp văn bản, các ràng buộc thực tế và dữ liệu tham khảo.

Bạn không cần dùng tất cả chúng mọi lúc. Nhưng chỉ cần thêm một hoặc hai trong số đó cũng có thể tạo ra sự khác biệt đáng kể.

Xác định khung hình bằng bố cục và tỷ lệ khung hình​

Đây là một trong những nâng cấp đơn giản nhất, và cũng là một trong những nâng cấp hiệu quả nhất. Nếu bạn không chỉ định tỷ lệ khung hình, bạn đang để hoàn toàn việc bố cục khung hình cho AI. Đó là lý do tại sao hình ảnh có thể trông bị cắt xén kỳ lạ hoặc hơi "lệch".
Thêm một đoạn như sau:
  • Tỷ lệ 16:9 cho chế độ ngang
  • Tỷ lệ 4:5 cho ảnh chân dung (một tỷ lệ tuyệt vời cho mọi mục đích)
  • 3:4 hoặc 2:3 để thay đổi
…ngay lập tức làm cho kết quả trông có vẻ chủ ý hơn. Bạn cũng có thể sử dụng cú pháp viết tắt như --ar 16:9 để tiết kiệm thời gian. Và nếu bạn đang tạo hình ảnh cho áp phích, hãy cho Gemini biết đó là áp phích, và nó sẽ giúp tạo ra hình ảnh tốt hơn.

Hãy suy nghĩ như một nhà quay phim về ánh sáng và chi tiết máy quay.​

Đây là lúc mọi thứ bắt đầu trông tốt hơn hẳn. Thay vì chỉ mô tả đối tượng, bạn đang chỉ đạo cách thức ghi lại hình ảnh. Ánh sáng, đặc biệt, có tác động rất lớn đến không khí và tính chân thực. Ví dụ:
“Ánh sáng ngược giờ vàng tạo ra những bóng dài”
“Ánh sáng theo phong cách Rembrandt với độ tương phản bóng tối sâu sắc”
Dưới đây là một ví dụ đầy đủ:
Yêu cầu:
Chân dung cận cảnh một người đàn ông lớn tuổi với làn da rám nắng, ánh sáng kiểu Rembrandt với hiệu ứng tương phản sáng tối sâu, một bên mặt chìm trong bóng tối, ánh sáng viền sắc nét chiếu vào mái tóc bạc, độ phân giải 8K , kết cấu chi tiết cao, tỷ lệ khung hình 16:9.

Đó là sự khác biệt giữa một hình ảnh được tạo ra bằng phần mềm và một hình ảnh được chụp một cách có chủ đích.
Hình ảnh một người đàn ông lớn tuổi được tạo ra bằng trí tuệ nhân tạo.

Hãy kiểm soát nội dung​

Các công cụ xử lý hình ảnh bằng AI hiện nay hiển thị văn bản tốt hơn nhiều so với trước đây, nhưng chỉ khi bạn cung cấp thông tin rõ ràng. Đừng chỉ nói "thêm văn bản". Hãy cho nó biết: văn bản đó là gì, đặt ở đâu và trông như thế nào.
Ví dụ của Gemini là:
“Tiêu đề 'URBAN EXPLORER' được in đậm, màu trắng, kiểu chữ sans-serif ở phía trên cùng.”
Khi được mở rộng thành một lời nhắc đầy đủ, nó trông như sau:
Yêu cầu:
Hình ảnh chụp phẳng một chiếc áo thun cotton đen cao cấp trên nền bê tông xám. Dòng chữ “URBAN EXPLORER” được in đậm, màu trắng, không chân, đặt chính giữa ngực. Ánh sáng studio dịu nhẹ từ trên xuống với những bóng đổ tinh tế làm nổi bật kết cấu vải. Độ phân giải cao, phong cách tối giản, tỷ lệ khung hình 16:9.
(Với trường hợp này, tỷ lệ 4:5 thường sẽ phù hợp hơn — nhưng tỷ lệ 16:9 lại rất vừa vặn với bố cục web.)
Hình ảnh do AI tạo ra về một chiếc áo phông có dòng chữ URBAN EXPLORER (Nhà thám hiểm đô thị) trên đó.

Hãy thử nghiệm với ba khía cạnh này và bạn sẽ thấy hình ảnh của mình bắt đầu được cải thiện đáng kể. Và nếu bạn cần trợ giúp với một đề bài cụ thể, đừng ngần ngại yêu cầu Gemini gợi ý hoặc chỉ cho bạn cách cải thiện đề bài bạn đã viết, bởi vì đó là mục đích của nó!
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly93d3cudm5yZXZpZXcudm4vdGhyZWFkcy9sb2kta2h1eWVuLXRhby1wcm9tcHQtdHUtY2hpbmgtZ2VtaW5pLWRlLXRhby1hbmgtdG90LWhvbi1nYXAtMTAtbGFuLjgyMTY1Lw==
Top