Trung Đào
Writer
Trình tạo hình ảnh mới của OpenAI rất đáng chú ý nhưng vẫn còn thiếu sót. Dưới đây là cách sử dụng tính năng beta trong ChatGPT Plus và một số lời khuyên để bắt đầu.
OpenAI vừa tích hợp trình tạo hình ảnh mới nhất Dall-E 3 vào ChatGPT. Công cụ này hiện đang ở giai đoạn thử nghiệm dành cho những người đăng ký ChatGPT Plus, dịch vụ trả phí 20 USD/tháng. Khi bật Dall-E 3, bạn có thể nhắc chatbot bằng ngôn ngữ thông thường để tạo một bộ gồm bốn hình ảnh riêng biệt.
Khi các công cụ tạo hình ảnh mạnh mẽ hơn, các vấn đề pháp lý và đạo đức đang trở nên nổi bật. Ví dụ, nhiều nghệ sĩ đã cố gắng kiện OpenAI vì có khả năng vi phạm bản quyền. Ngoài những lo ngại về mặt pháp lý, các chuyên gia bảo mật còn bày tỏ lo ngại về khả năng các trình tạo hình ảnh AI có thể tạo điều kiện cho thông tin sai lệch lan rộng hơn nữa.
Nếu bạn muốn dùng thử Dall-E 3 miễn phí, một phiên bản có sẵn thông qua Bing Image Creator của Microsoft. Trong những ngày đầu tiên tích hợp, người dùng đã tạo ra những hình ảnh cực chất bằng cách sử dụng Bing, giống như SpongeBob lái máy bay về phía Tòa Tháp Đôi. Kể từ đó, Microsoft đã bổ sung thêm nhiều biện pháp bảo vệ xung quanh trình tạo hình ảnh AI.
Đối với bất kỳ ai tò mò về việc sử dụng ChatGPT với Dall-E 3 để tạo hình ảnh, đây là cách bắt đầu và một số lời khuyên dựa trên kinh nghiệm thử nghiệm các công cụ chatbot mới của tôi.
Có giới hạn mức sử dụng về tần suất bạn có thể tương tác với phiên bản GPT-4 của ChatGPT. (Những câu lệnh này cần rất nhiều năng lượng máy tính để xử lý!) Giới hạn chính thức được đặt ở 50 lời nhắc cứ sau ba giờ. Nếu bạn chạm vào bức tường này, chatbot sẽ hiển thị thông báo lỗi cho biết bạn sẽ phải đợi bao lâu trước khi lấy lại quyền truy cập.
Vượt quá giới hạn tốc độ, hãy chuẩn bị chờ khoảng 30 giây để hình ảnh đến. Nếu bất kỳ sáng tạo nào đi ngược lại nguyên tắc của OpenAI, bạn chỉ có thể nhận được những hình ảnh tuân thủ hoặc thậm chí là thông báo từ chối yêu cầu.
Nếu trước đây bạn đã từng thử nghiệm trình tạo hình ảnh AI, như Dall-E 2 hoặc Midjourney , thì một trong những khác biệt lớn nhất là giờ đây bạn có thể xem cách ChatGPT hoạt động như một trung gian, tạo ra nhiều lời nhắc để Dall-E 3 hoàn thành.
Những lời nhắc do ChatGPT tạo ra bao gồm từ các câu dài đến các đoạn văn hoàn chỉnh và mỗi lời nhắc bao gồm các chi tiết khác nhau cho Dall-E 3. Nếu có người trong ảnh, chatbot thường sẽ đề cập rõ ràng đến giới tính và chủng tộc của đối tượng. Ví dụ: đây là một trong những lời nhắc của Dall-E 3 mà ChatGPT sử dụng khi tôi yêu cầu hình ảnh hai phóng viên WIRED đang phỏng vấn một CEO:
“Bức ảnh chụp một nhóm đa dạng gồm ba người trong bối cảnh công ty: một nữ phóng viên WIRED người Trung Đông cầm máy ảnh, một nữ phóng viên WIRED người Châu Phi cầm micro và một nam CEO người da trắng trả lời câu hỏi của họ. Phông nền là khu vực tiếp khách văn phòng kiểu dáng đẹp”.
Nếu bạn không thích kết quả đầu tiên mà chatbot đưa ra, hãy yêu cầu điều chỉnh một số khía cạnh, như cách phối màu hoặc cảm giác tổng thể. Giả sử bạn thực sự thích hình ảnh thứ ba mà Dall-E 3 tạo ra từ lời nhắc của bạn. Sau khi nhấp vào nút tải xuống ở góc trên cùng bên trái, bạn có thể yêu cầu thêm hình ảnh trông giống với tùy chọn thứ ba.
Có điều gì đã được thực hiện để bảo vệ các nghệ sĩ trong bản cập nhật mới này không? Không thực sự. Mặc dù chatbot sẽ không tạo ra hình ảnh nếu bạn yêu cầu nó bắt chước một nghệ sĩ đương đại nhưng vẫn có rấ nhiều cách giải quyết.
Tôi đã nhờ ChatGPT thiết kế một chiếc cốc cà phê đầy tính nghệ thuật theo phong cách của Keith Haring. Công cụ AI đã từ chối lời đề nghị ban đầu nhưng đưa ra một thỏa hiệp: “Tôi có thể tạo ra một thiết kế lấy cảm hứng từ những đặc điểm chung trong nghệ thuật của anh ấy, chẳng hạn như những đường nét đậm, màu sắc rực rỡ và những hình khối đơn giản. Bạn có muốn tôi tiếp tục việc đó không?” Trong trường hợp này, kết quả cuối cùng từ ChatGPT rất lộn xộn và tầm thường.
Với Dall-E 3, nghệ thuật từ một số lời nhắc có thể được coi là do con người tạo ra cho đến khi bạn nhìn kỹ vào nền và các chi tiết đẹp hơn. Mặc dù đã có những cải thiện về chất lượng nhưng vẫn còn nhiều vấn đề cơ bản với trình tạo hình ảnh.
Mong đợi những biến dạng kỳ lạ và những khuôn mặt kỳ lạ trong những hình ảnh mà Dall-E 3 tạo ra. Các vấn đề có thể hài hước, chẳng hạn như một chatbot đang cố gắng ghi nhãn nguyên liệu làm bánh, nhưng những lỗi khác còn nghiêm trọng hơn. Khi được yêu cầu tạo một bản đồ phác thảo Israel và Dải Gaza, ChatGPT liên tục gắn nhãn sai cho Gaza là một phần của Biển Địa Trung Hải.
Một vấn đề khác đối với các trình tạo hình ảnh là các công cụ này thường quay lại các khuôn mẫu phân biệt chủng tộc khi mô tả con người. Dall-E 3 cũng không ngoại lệ. Trong số 20 hình ảnh mà tôi đã yêu cầu ChatGPT tạo mô tả “phóng viên WIRED”, chatbot đã yêu cầu cách thể hiện cụ thể, đa dạng cho các hình ảnh, chỉ với một vài ngoại lệ. Khi ChatGPT không thêm chủng tộc hoặc giới tính vào lời nhắc, kết quả đều là người da trắng và chủ yếu là nam giới.
Nguồn: Wired
Khi các công cụ tạo hình ảnh mạnh mẽ hơn, các vấn đề pháp lý và đạo đức đang trở nên nổi bật. Ví dụ, nhiều nghệ sĩ đã cố gắng kiện OpenAI vì có khả năng vi phạm bản quyền. Ngoài những lo ngại về mặt pháp lý, các chuyên gia bảo mật còn bày tỏ lo ngại về khả năng các trình tạo hình ảnh AI có thể tạo điều kiện cho thông tin sai lệch lan rộng hơn nữa.
Nếu bạn muốn dùng thử Dall-E 3 miễn phí, một phiên bản có sẵn thông qua Bing Image Creator của Microsoft. Trong những ngày đầu tiên tích hợp, người dùng đã tạo ra những hình ảnh cực chất bằng cách sử dụng Bing, giống như SpongeBob lái máy bay về phía Tòa Tháp Đôi. Kể từ đó, Microsoft đã bổ sung thêm nhiều biện pháp bảo vệ xung quanh trình tạo hình ảnh AI.
Đối với bất kỳ ai tò mò về việc sử dụng ChatGPT với Dall-E 3 để tạo hình ảnh, đây là cách bắt đầu và một số lời khuyên dựa trên kinh nghiệm thử nghiệm các công cụ chatbot mới của tôi.
Cách truy cập Dall-E 3 trong ChatGPT
Nếu bạn là người đăng ký ChatGPT Plus, việc bật tính năng Dall-E 3 của chatbot khá đơn giản. Đầu tiên, đăng nhập vào trang web của OpenAI hoặc ứng dụng di động ChatGPT (Apple, Android). Sau khi mở ChatGPT, nhấp vào tab GPT-4 ở đầu màn hình. Trong menu thả xuống bật lên, chọn Dall-E 3 (Beta).Có giới hạn mức sử dụng về tần suất bạn có thể tương tác với phiên bản GPT-4 của ChatGPT. (Những câu lệnh này cần rất nhiều năng lượng máy tính để xử lý!) Giới hạn chính thức được đặt ở 50 lời nhắc cứ sau ba giờ. Nếu bạn chạm vào bức tường này, chatbot sẽ hiển thị thông báo lỗi cho biết bạn sẽ phải đợi bao lâu trước khi lấy lại quyền truy cập.
Vượt quá giới hạn tốc độ, hãy chuẩn bị chờ khoảng 30 giây để hình ảnh đến. Nếu bất kỳ sáng tạo nào đi ngược lại nguyên tắc của OpenAI, bạn chỉ có thể nhận được những hình ảnh tuân thủ hoặc thậm chí là thông báo từ chối yêu cầu.
Lời khuyên khi thử nghiệm với Dall-E 3
Những lời nhắc do ChatGPT tạo ra bao gồm từ các câu dài đến các đoạn văn hoàn chỉnh và mỗi lời nhắc bao gồm các chi tiết khác nhau cho Dall-E 3. Nếu có người trong ảnh, chatbot thường sẽ đề cập rõ ràng đến giới tính và chủng tộc của đối tượng. Ví dụ: đây là một trong những lời nhắc của Dall-E 3 mà ChatGPT sử dụng khi tôi yêu cầu hình ảnh hai phóng viên WIRED đang phỏng vấn một CEO:
“Bức ảnh chụp một nhóm đa dạng gồm ba người trong bối cảnh công ty: một nữ phóng viên WIRED người Trung Đông cầm máy ảnh, một nữ phóng viên WIRED người Châu Phi cầm micro và một nam CEO người da trắng trả lời câu hỏi của họ. Phông nền là khu vực tiếp khách văn phòng kiểu dáng đẹp”.
Nếu bạn không thích kết quả đầu tiên mà chatbot đưa ra, hãy yêu cầu điều chỉnh một số khía cạnh, như cách phối màu hoặc cảm giác tổng thể. Giả sử bạn thực sự thích hình ảnh thứ ba mà Dall-E 3 tạo ra từ lời nhắc của bạn. Sau khi nhấp vào nút tải xuống ở góc trên cùng bên trái, bạn có thể yêu cầu thêm hình ảnh trông giống với tùy chọn thứ ba.
Có điều gì đã được thực hiện để bảo vệ các nghệ sĩ trong bản cập nhật mới này không? Không thực sự. Mặc dù chatbot sẽ không tạo ra hình ảnh nếu bạn yêu cầu nó bắt chước một nghệ sĩ đương đại nhưng vẫn có rấ nhiều cách giải quyết.
Tôi đã nhờ ChatGPT thiết kế một chiếc cốc cà phê đầy tính nghệ thuật theo phong cách của Keith Haring. Công cụ AI đã từ chối lời đề nghị ban đầu nhưng đưa ra một thỏa hiệp: “Tôi có thể tạo ra một thiết kế lấy cảm hứng từ những đặc điểm chung trong nghệ thuật của anh ấy, chẳng hạn như những đường nét đậm, màu sắc rực rỡ và những hình khối đơn giản. Bạn có muốn tôi tiếp tục việc đó không?” Trong trường hợp này, kết quả cuối cùng từ ChatGPT rất lộn xộn và tầm thường.
Với Dall-E 3, nghệ thuật từ một số lời nhắc có thể được coi là do con người tạo ra cho đến khi bạn nhìn kỹ vào nền và các chi tiết đẹp hơn. Mặc dù đã có những cải thiện về chất lượng nhưng vẫn còn nhiều vấn đề cơ bản với trình tạo hình ảnh.
Mong đợi những biến dạng kỳ lạ và những khuôn mặt kỳ lạ trong những hình ảnh mà Dall-E 3 tạo ra. Các vấn đề có thể hài hước, chẳng hạn như một chatbot đang cố gắng ghi nhãn nguyên liệu làm bánh, nhưng những lỗi khác còn nghiêm trọng hơn. Khi được yêu cầu tạo một bản đồ phác thảo Israel và Dải Gaza, ChatGPT liên tục gắn nhãn sai cho Gaza là một phần của Biển Địa Trung Hải.
Một vấn đề khác đối với các trình tạo hình ảnh là các công cụ này thường quay lại các khuôn mẫu phân biệt chủng tộc khi mô tả con người. Dall-E 3 cũng không ngoại lệ. Trong số 20 hình ảnh mà tôi đã yêu cầu ChatGPT tạo mô tả “phóng viên WIRED”, chatbot đã yêu cầu cách thể hiện cụ thể, đa dạng cho các hình ảnh, chỉ với một vài ngoại lệ. Khi ChatGPT không thêm chủng tộc hoặc giới tính vào lời nhắc, kết quả đều là người da trắng và chủ yếu là nam giới.
Nguồn: Wired