Nhai kỹ sống chậm
Writer
Từ Cape Town đến Chicago, từ Los Angeles đến Ranchi, hàng chục nghìn người đang bán những mảnh vụn cuộc sống của mình cho các công ty công nghệ, từ tiếng bước chân, giọng nói điện thoại cho đến cảnh rửa bát hay lau bếp. Hai giờ quay video việc nhà đổi được 80 đô la. Một phút ghi âm cuộc gọi có giá 0,5 đô la. Bình thường thôi, cho đến khi bạn đọc kỹ hợp đồng.
Jacobs Love, 27 tuổi, người Nam Phi, mỗi ngày chụp ảnh dấu chân và cảnh vật dọc đường đi cho chim mòng biển ăn rồi tải lên ứng dụng Kled AI. Một video "điều hướng thành phố" dài chục giây mang về 14 đô la. Sahir Tiga, sinh viên 22 tuổi ở Ấn Độ, để micro điện thoại bật suốt ngày qua ứng dụng Silencio, thu âm tiếng ồn nhà hàng và giao thông. Anh còn chủ động đến sảnh khách sạn để ghi những âm thanh hiếm gặp hơn, kiếm hơn 100 đô la mỗi tháng, đủ trang trải sinh hoạt phí.
Tại Los Angeles, hàng trăm người đeo camera trên đầu khi làm việc nhà. Salvador Alciga nhận giá đỡ điện thoại từ Instawork, về nhà tự quay cảnh rửa bát và lau bếp, vừa làm vừa thuyết minh bằng tiếng Tây Ban Nha hoặc tiếng Anh. "Dù sao tôi cũng phải làm việc nhà," anh nói, "giờ còn kiếm được tiền từ đó nữa."
Vấn đề còn nan giải hơn với robot. Anders Baker, Phó chủ tịch phụ trách Robot AI tại Universal Robots, chỉ ra rằng robot không thể học cách mở cửa hay gấp quần áo chỉ từ phản hồi hình ảnh trong phòng thí nghiệm. Chúng cần được con người hướng dẫn lặp đi lặp lại trong môi trường thực tế. Chính vì vậy, nhiều quốc gia đã mở các cơ sở chuyên biệt, nơi hàng trăm người quay video góc nhìn thứ nhất về mọi thao tác sinh hoạt hàng ngày để làm dữ liệu huấn luyện.
CB Insights dự đoán thị trường thu thập và gắn nhãn dữ liệu toàn cầu có thể đạt 17 tỷ đô la vào năm 2030. Đó là lý do vốn đầu tư đang đổ vào ồ ạt: Encord huy động được 60 triệu đô la hồi tháng Hai, Scale AI được Meta hậu thuẫn đã thu thập 100.000 giờ video robot, còn đối thủ Micro1 sử dụng 1.000 người ở 60 quốc gia chỉ để ghi hình việc nhà.
Lameria Hill, thợ hàn 18 tuổi ở Chicago, bán 11 giờ nhật ký cuộc gọi cho Neon Mobile với giá 300 đô la. Vài tuần sau khi ứng dụng ra mắt, TechCrunch phát hiện một lỗ hổng bảo mật cho phép bất kỳ ai trực tuyến đều có thể truy cập số điện thoại, bản ghi âm và tin nhắn của người dùng. Neon không bao giờ thông báo cho Hill. Giờ anh không biết giọng mình đang được dùng ở đâu.
Adam Coy, diễn viên ở New York, bán hình ảnh của mình cho phần mềm AI Captions với 1.000 đô la năm 2024, kèm theo nhiều điều khoản bảo vệ chặt chẽ: không dùng cho mục đích chính trị, không quảng cáo rượu hay thuốc lá, giấy phép hết hạn sau một năm. Không lâu sau, bạn bè anh bắt đầu gửi video đang lan truyền trên mạng, trong đó khuôn mặt và giọng nói của anh được dùng để quảng bá một sản phẩm sức khỏe chưa được chứng minh dành cho phụ nữ mang thai. "Những bình luận đó bình luận về ngoại hình của tôi, nhưng đó hoàn toàn không phải là con người thật của tôi," anh nói.
Giáo sư luật Enrico Bonadio tại City of London St George chỉ ra rằng ngay cả khi nền tảng cam kết "xóa bỏ thông tin nhận dạng", các đặc điểm sinh trắc học như giọng nói và khuôn mặt về bản chất rất khó ẩn danh hoàn toàn. Jennifer King, nhà nghiên cứu về quyền riêng tư tại Đại học Stanford, nói thẳng: người dùng "hầu như không có cách nào phản kháng" khi dữ liệu bị dùng theo cách họ không lường trước.
Mark Graham, giáo sư địa lý internet tại Đại học Oxford, cảnh báo thẳng: thị trường này được thúc đẩy bởi "sự cạnh tranh xuống đáy về tiền lương" và "nhu cầu tạm thời về dữ liệu con người". Khi nhu cầu thay đổi, người lao động không có kỹ năng chuyển giao, không có bảo hộ, và những kẻ thực sự hưởng lợi là các nền tảng công nghệ nắm giữ toàn bộ giá trị lâu dài.
Nói cách khác, mỗi đồng kiếm được hôm nay đang giúp AI trở nên mạnh hơn. Và khi AI đủ mạnh, những người huấn luyện nó có thể sẽ là những người đầu tiên bị thay thế.
Một người bạn từng hỏi Alciga: "Cậu đang dạy AI làm những việc chỉ con người làm được, chẳng phải cậu đang làm mọi thứ tồi tệ hơn sao?" Anh trả lời rằng công nghệ mới nào cũng mang đến sự thay đổi, nhưng cũng tạo ra những công việc mới. "Con người vẫn cần con người," anh nói. Câu hỏi là, đến khi nào thì điều đó còn đúng.
Jacobs Love, 27 tuổi, người Nam Phi, mỗi ngày chụp ảnh dấu chân và cảnh vật dọc đường đi cho chim mòng biển ăn rồi tải lên ứng dụng Kled AI. Một video "điều hướng thành phố" dài chục giây mang về 14 đô la. Sahir Tiga, sinh viên 22 tuổi ở Ấn Độ, để micro điện thoại bật suốt ngày qua ứng dụng Silencio, thu âm tiếng ồn nhà hàng và giao thông. Anh còn chủ động đến sảnh khách sạn để ghi những âm thanh hiếm gặp hơn, kiếm hơn 100 đô la mỗi tháng, đủ trang trải sinh hoạt phí.
Tại Los Angeles, hàng trăm người đeo camera trên đầu khi làm việc nhà. Salvador Alciga nhận giá đỡ điện thoại từ Instawork, về nhà tự quay cảnh rửa bát và lau bếp, vừa làm vừa thuyết minh bằng tiếng Tây Ban Nha hoặc tiếng Anh. "Dù sao tôi cũng phải làm việc nhà," anh nói, "giờ còn kiếm được tiền từ đó nữa."
AI đang đói dữ liệu
Lý do những sinh hoạt tẻ nhạt này bỗng có giá là vì các mô hình AI đang đứng trước nguy cơ cạn kiệt nguyên liệu. Tổ chức nghiên cứu Epoch AI dự đoán đến năm 2026, các công ty AI sẽ không còn đủ dữ liệu văn bản mới để huấn luyện. Một số phòng thí nghiệm đang thử nghiệm cho AI tự tạo dữ liệu để "tự học", nhưng hướng này có nguy cơ làm chất lượng mô hình suy giảm dần.
Vấn đề còn nan giải hơn với robot. Anders Baker, Phó chủ tịch phụ trách Robot AI tại Universal Robots, chỉ ra rằng robot không thể học cách mở cửa hay gấp quần áo chỉ từ phản hồi hình ảnh trong phòng thí nghiệm. Chúng cần được con người hướng dẫn lặp đi lặp lại trong môi trường thực tế. Chính vì vậy, nhiều quốc gia đã mở các cơ sở chuyên biệt, nơi hàng trăm người quay video góc nhìn thứ nhất về mọi thao tác sinh hoạt hàng ngày để làm dữ liệu huấn luyện.
CB Insights dự đoán thị trường thu thập và gắn nhãn dữ liệu toàn cầu có thể đạt 17 tỷ đô la vào năm 2030. Đó là lý do vốn đầu tư đang đổ vào ồ ạt: Encord huy động được 60 triệu đô la hồi tháng Hai, Scale AI được Meta hậu thuẫn đã thu thập 100.000 giờ video robot, còn đối thủ Micro1 sử dụng 1.000 người ở 60 quốc gia chỉ để ghi hình việc nhà.
Bạn bán giọng nói, nhưng không biết nó sẽ đi đâu
Vấn đề là hầu hết người cung cấp dữ liệu không thực sự hiểu mình đã ký gì. Khi dùng Neon Mobile hay Kled AI, người dùng mặc nhiên trao cho nền tảng một "giấy phép đầy đủ", toàn cầu, không thể thu hồi, có thể chuyển nhượng và miễn phí bản quyền mãi mãi. Nền tảng có thể bán, hiển thị công khai hoặc tạo ra "tác phẩm phái sinh" từ dữ liệu đó mà không cần hỏi lại.Lameria Hill, thợ hàn 18 tuổi ở Chicago, bán 11 giờ nhật ký cuộc gọi cho Neon Mobile với giá 300 đô la. Vài tuần sau khi ứng dụng ra mắt, TechCrunch phát hiện một lỗ hổng bảo mật cho phép bất kỳ ai trực tuyến đều có thể truy cập số điện thoại, bản ghi âm và tin nhắn của người dùng. Neon không bao giờ thông báo cho Hill. Giờ anh không biết giọng mình đang được dùng ở đâu.
Adam Coy, diễn viên ở New York, bán hình ảnh của mình cho phần mềm AI Captions với 1.000 đô la năm 2024, kèm theo nhiều điều khoản bảo vệ chặt chẽ: không dùng cho mục đích chính trị, không quảng cáo rượu hay thuốc lá, giấy phép hết hạn sau một năm. Không lâu sau, bạn bè anh bắt đầu gửi video đang lan truyền trên mạng, trong đó khuôn mặt và giọng nói của anh được dùng để quảng bá một sản phẩm sức khỏe chưa được chứng minh dành cho phụ nữ mang thai. "Những bình luận đó bình luận về ngoại hình của tôi, nhưng đó hoàn toàn không phải là con người thật của tôi," anh nói.
Giáo sư luật Enrico Bonadio tại City of London St George chỉ ra rằng ngay cả khi nền tảng cam kết "xóa bỏ thông tin nhận dạng", các đặc điểm sinh trắc học như giọng nói và khuôn mặt về bản chất rất khó ẩn danh hoàn toàn. Jennifer King, nhà nghiên cứu về quyền riêng tư tại Đại học Stanford, nói thẳng: người dùng "hầu như không có cách nào phản kháng" khi dữ liệu bị dùng theo cách họ không lường trước.
Ai thực sự thắng trong cuộc chơi này?
Uber và DoorDash đang đi theo hướng tương tự, biến kinh nghiệm lái xe và giao hàng của tài xế thành tài sản dữ liệu bán lại cho các công ty cần huấn luyện AI. Uber AI Solutions đã mở rộng sang 30 quốc gia, cung cấp dịch vụ chú thích, dịch thuật và huấn luyện mô hình.Mark Graham, giáo sư địa lý internet tại Đại học Oxford, cảnh báo thẳng: thị trường này được thúc đẩy bởi "sự cạnh tranh xuống đáy về tiền lương" và "nhu cầu tạm thời về dữ liệu con người". Khi nhu cầu thay đổi, người lao động không có kỹ năng chuyển giao, không có bảo hộ, và những kẻ thực sự hưởng lợi là các nền tảng công nghệ nắm giữ toàn bộ giá trị lâu dài.
Nói cách khác, mỗi đồng kiếm được hôm nay đang giúp AI trở nên mạnh hơn. Và khi AI đủ mạnh, những người huấn luyện nó có thể sẽ là những người đầu tiên bị thay thế.
Một người bạn từng hỏi Alciga: "Cậu đang dạy AI làm những việc chỉ con người làm được, chẳng phải cậu đang làm mọi thứ tồi tệ hơn sao?" Anh trả lời rằng công nghệ mới nào cũng mang đến sự thay đổi, nhưng cũng tạo ra những công việc mới. "Con người vẫn cần con người," anh nói. Câu hỏi là, đến khi nào thì điều đó còn đúng.