Chức năng tìm kiếm trên Google bằng hình ảnh thuộc loại AI nào

Phạm Thanh Bình
Phạm Thanh Bình
Phản hồi: 0
Chức năng tìm kiếm bằng hình ảnh trên Google – gọi là Google Lens – thuộc loại AI thị giác máy tính (Computer Vision), cụ thể là nhánh của AI nhận dạng hình ảnh. Đây là lĩnh vực giúp máy móc có khả năng “nhìn” và “hiểu” hình ảnh giống như con người. Khi người dùng đưa một bức ảnh vào ô tìm kiếm – chẳng hạn ảnh chụp một đôi giày, một loài cây hay một trang sách – hệ thống AI của Google sẽ phân tích các đặc điểm trực quan như màu sắc, hình dáng, kết cấu, rồi đối chiếu với kho dữ liệu khổng lồ để nhận diện đối tượng trong ảnh.
1747292054237.png

Công nghệ đứng sau quá trình này không chỉ đơn thuần là nhận dạng hình ảnh, mà còn bao gồm khả năng trích xuất văn bản từ ảnh (gọi là OCR – nhận dạng ký tự quang học) và hiểu được ngữ cảnh của truy vấn. Chẳng hạn, nếu bạn chụp ảnh một món ăn, AI không chỉ đoán tên món mà còn có thể gợi ý địa điểm gần nhất bán món đó. Điều này là nhờ sự kết hợp giữa phân tích hình ảnh và xử lý ngôn ngữ tự nhiên (NLP), một hướng tiếp cận AI đa phương thức – nơi mà hình ảnh và văn bản cùng được xử lý để hiểu ý định người dùng.

Nói một cách đơn giản, Google Lens là một ví dụ rõ ràng về việc AI đã tiến xa như thế nào trong việc hiểu thế giới hình ảnh. Nó không hoạt động giống một chatbot như ChatGPT, mà thay vào đó là một hệ thống nhìn – hiểu – phản hồi dựa trên hình ảnh, dựa vào các mô hình học sâu được huấn luyện trên hàng tỷ dữ liệu trực quan. Trong thời đại hiện tại, khi tìm kiếm không còn giới hạn ở gõ từ khóa, việc tìm bằng ảnh – và khả năng AI hiểu được ảnh – đang mở ra một cách tương tác tự nhiên và mạnh mẽ hơn giữa con người và công cụ tìm kiếm.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top