Minh Nguyệt
Intern Writer
Hệ thống trí tuệ nhân tạo hiện nay đã đạt được những tiến bộ đáng kể trong việc nhận diện các hình ảnh đơn giản như tòa nhà, xe cộ hay con người. Tuy nhiên, khi phải nhận diện những cảnh vật phức tạp hơn, độ chính xác của chúng lại đặt ra nhiều câu hỏi. Đây chính là một trong những thách thức lớn mà công nghệ xe tự lái đang phải đối mặt. Các hệ thống thị giác AI cần phải xác định chính xác các tòa nhà, xe cộ và con người cùng một lúc, trong những môi trường động như những giao lộ đông đúc.
Mengye Ren, một giáo sư trợ lý tại Viện Khoa học Toán học Courant và Trung tâm Khoa học Dữ liệu của Đại học New York (NYU), đã đặt ra câu hỏi: "Liệu chúng ta có thể phát triển một thuật toán học máy có khả năng xử lý trực tiếp dữ liệu từ những gì chúng ta trải nghiệm, thay vì chỉ nhận diện những hình ảnh đơn giản trên màn hình máy tính?" Để trả lời cho câu hỏi này, Ren cùng các đồng nghiệp đang phát triển một thuật toán mới, giúp cho các hệ thống AI có thể học hỏi từ môi trường xung quanh, bất kể là một con phố, đại dương hay thậm chí là một hành tinh khác.
Phương pháp mà họ đang nghiên cứu mang tên PooDLe, được lấy cảm hứng từ cách mà con người và động vật xử lý những cảnh vật rối rắm. PooDLe có khả năng nắm bắt cả hình ảnh ở tiền cảnh như những người đi bộ đang băng qua đường và những hình ảnh ở hậu cảnh như các ngã tư xa xôi, thông qua "dòng chảy quang học" - một thông tin về cách mà các pixel di chuyển giữa các khung hình video. Quá trình này cho phép nhận diện các khu vực có chứa cùng một đối tượng theo thời gian, ví dụ như một người đi bộ di chuyển từ lề đường đến vạch qua đường và tiếp tục đi xuống một con phố đông đúc.
Mengye Ren nhấn mạnh: "PooDLe kết hợp những ưu điểm của các công cụ thị giác AI hiện có, giúp nhận diện cả những đối tượng lớn lẫn nhỏ." Ông cho biết thêm rằng mục tiêu của nhóm là tiếp tục cải tiến công cụ này để nó có thể nhận biết nhiều đối tượng khác nhau trong một cảnh vật, ví dụ như xe cộ, đường phố, tín hiệu giao thông, xe đạp và nhiều hơn thế nữa.
Với những cải tiến này, hy vọng rằng công nghệ xe tự lái sẽ có những bước tiến lớn hơn trong việc hoạt động an toàn và hiệu quả hơn trong môi trường thực tế.
Nguồn tham khảo: Techxplore
Mengye Ren, một giáo sư trợ lý tại Viện Khoa học Toán học Courant và Trung tâm Khoa học Dữ liệu của Đại học New York (NYU), đã đặt ra câu hỏi: "Liệu chúng ta có thể phát triển một thuật toán học máy có khả năng xử lý trực tiếp dữ liệu từ những gì chúng ta trải nghiệm, thay vì chỉ nhận diện những hình ảnh đơn giản trên màn hình máy tính?" Để trả lời cho câu hỏi này, Ren cùng các đồng nghiệp đang phát triển một thuật toán mới, giúp cho các hệ thống AI có thể học hỏi từ môi trường xung quanh, bất kể là một con phố, đại dương hay thậm chí là một hành tinh khác.

Phương pháp mà họ đang nghiên cứu mang tên PooDLe, được lấy cảm hứng từ cách mà con người và động vật xử lý những cảnh vật rối rắm. PooDLe có khả năng nắm bắt cả hình ảnh ở tiền cảnh như những người đi bộ đang băng qua đường và những hình ảnh ở hậu cảnh như các ngã tư xa xôi, thông qua "dòng chảy quang học" - một thông tin về cách mà các pixel di chuyển giữa các khung hình video. Quá trình này cho phép nhận diện các khu vực có chứa cùng một đối tượng theo thời gian, ví dụ như một người đi bộ di chuyển từ lề đường đến vạch qua đường và tiếp tục đi xuống một con phố đông đúc.
Mengye Ren nhấn mạnh: "PooDLe kết hợp những ưu điểm của các công cụ thị giác AI hiện có, giúp nhận diện cả những đối tượng lớn lẫn nhỏ." Ông cho biết thêm rằng mục tiêu của nhóm là tiếp tục cải tiến công cụ này để nó có thể nhận biết nhiều đối tượng khác nhau trong một cảnh vật, ví dụ như xe cộ, đường phố, tín hiệu giao thông, xe đạp và nhiều hơn thế nữa.
Với những cải tiến này, hy vọng rằng công nghệ xe tự lái sẽ có những bước tiến lớn hơn trong việc hoạt động an toàn và hiệu quả hơn trong môi trường thực tế.
Nguồn tham khảo: Techxplore