Duy Linh
Writer
Sự ra đời của các trình duyệt tích hợp trí tuệ nhân tạo (AI) như Atlas của OpenAI đang tạo ra bước ngoặt trong cách con người tương tác với nội dung web. Không chỉ dừng lại ở khả năng hỗ trợ người dùng tra cứu hay tổng hợp thông tin, những trình duyệt này còn được trang bị “khả năng tác nhân” – công cụ cho phép chúng tự động thực hiện các tác vụ phức tạp, nhiều bước như một người dùng thật.
Trình duyệt AI đánh bại tường phí bằng cách bắt chước con người
Atlas cùng các đối thủ như Comet của Perplexity hay chế độ Copilot của Microsoft Edge đang mở ra kỷ nguyên mới cho AI duyệt web. Tuy nhiên, công nghệ này cũng đặt ra vấn đề nghiêm trọng về quyền sở hữu trí tuệ. Khi được thử nghiệm, Atlas và Comet đã truy xuất được toàn văn các bài viết chỉ dành cho thuê bao của MIT Technology Review, điều mà các hệ thống như ChatGPT hay Perplexity trong chế độ thông thường không thể làm được.
Nguyên nhân nằm ở cách thức vận hành. Đối với các trang web, Atlas xuất hiện như một người dùng thật sử dụng trình duyệt Chrome, khiến các biện pháp bảo vệ như Giao thức loại trừ robot (robots.txt) trở nên vô hiệu. Các nhà xuất bản có thể chặn trình thu thập dữ liệu, nhưng không thể phân biệt giữa người dùng thật và tác nhân AI, dẫn đến nguy cơ chặn nhầm người truy cập hợp pháp.
Atlas của OpenAI đã có thể lấy được toàn văn bài viết độc quyền của người đăng ký từ MIT Technology Review .
Vấn đề trở nên phức tạp hơn khi các tác nhân AI như Atlas không thể truy cập nội dung bị chặn trực tiếp. Chúng sử dụng chiến thuật “tái tạo ngược” – tổng hợp thông tin từ nhiều nguồn, tweet hoặc bản sao chép trực tuyến để tạo nên nội dung tương tự. Ví dụ, khi được yêu cầu tóm tắt bài viết của PCMag (thuộc tập đoàn Ziff Davis, đơn vị đã kiện OpenAI vì vi phạm bản quyền), Atlas vẫn tạo ra bản tóm tắt hoàn chỉnh mà không cần truy cập trực tiếp.
Atlas tránh truy cập vào nội dung của tờ New York Times , thay vào đó tạo ra bản tóm tắt các báo cáo liên quan từ các nguồn khác.
OpenAI khẳng định họ không sử dụng nội dung mà người dùng truy cập qua Atlas để huấn luyện mô hình, trừ khi người dùng bật “bộ nhớ trình duyệt”. Tuy nhiên, vẫn còn nhiều nghi vấn về lượng dữ liệu mà hệ thống có thể thu thập từ các nội dung trả phí.
Khi các trình duyệt AI ngày càng thông minh, khả năng vượt qua các biện pháp bảo vệ truyền thống như tường phí hay chặn bot khiến ngành xuất bản kỹ thuật số đối mặt thách thức lớn. Nếu không có cơ chế giám sát và kiểm soát rõ ràng, các nhà xuất bản sẽ mất quyền kiểm soát đối với cách nội dung của họ được truy cập, sử dụng và tái tạo bởi những hệ thống AI thế hệ mới.
Đọc chi tiết tại đây: https://gbhackers.com/ai-browsers/
Trình duyệt AI đánh bại tường phí bằng cách bắt chước con người
Atlas cùng các đối thủ như Comet của Perplexity hay chế độ Copilot của Microsoft Edge đang mở ra kỷ nguyên mới cho AI duyệt web. Tuy nhiên, công nghệ này cũng đặt ra vấn đề nghiêm trọng về quyền sở hữu trí tuệ. Khi được thử nghiệm, Atlas và Comet đã truy xuất được toàn văn các bài viết chỉ dành cho thuê bao của MIT Technology Review, điều mà các hệ thống như ChatGPT hay Perplexity trong chế độ thông thường không thể làm được.
Nguyên nhân nằm ở cách thức vận hành. Đối với các trang web, Atlas xuất hiện như một người dùng thật sử dụng trình duyệt Chrome, khiến các biện pháp bảo vệ như Giao thức loại trừ robot (robots.txt) trở nên vô hiệu. Các nhà xuất bản có thể chặn trình thu thập dữ liệu, nhưng không thể phân biệt giữa người dùng thật và tác nhân AI, dẫn đến nguy cơ chặn nhầm người truy cập hợp pháp.
Atlas của OpenAI đã có thể lấy được toàn văn bài viết độc quyền của người đăng ký từ MIT Technology Review .
Khi tường phí không còn là rào cản với AI
Nhiều tờ báo như National Geographic hay Philadelphia Inquirer áp dụng tường phí phía máy khách, nội dung được tải sẵn nhưng bị ẩn, chỉ hiện ra khi người đọc đăng ký. Tuy nhiên, trình duyệt AI có thể đọc mã nguồn và trích xuất toàn bộ nội dung. Trong khi đó, các tờ như Wall Street Journal hay Bloomberg dùng tường phí phía máy chủ, phương pháp an toàn hơn vì ngăn dữ liệu hiển thị cho đến khi đăng nhập thành công. Nhưng ngay cả vậy, khi người dùng đã đăng nhập, các trình duyệt AI vẫn có thể đọc toàn bộ nội dung thay mặt họ.Vấn đề trở nên phức tạp hơn khi các tác nhân AI như Atlas không thể truy cập nội dung bị chặn trực tiếp. Chúng sử dụng chiến thuật “tái tạo ngược” – tổng hợp thông tin từ nhiều nguồn, tweet hoặc bản sao chép trực tuyến để tạo nên nội dung tương tự. Ví dụ, khi được yêu cầu tóm tắt bài viết của PCMag (thuộc tập đoàn Ziff Davis, đơn vị đã kiện OpenAI vì vi phạm bản quyền), Atlas vẫn tạo ra bản tóm tắt hoàn chỉnh mà không cần truy cập trực tiếp.
Atlas tránh truy cập vào nội dung của tờ New York Times , thay vào đó tạo ra bản tóm tắt các báo cáo liên quan từ các nguồn khác.
OpenAI khẳng định họ không sử dụng nội dung mà người dùng truy cập qua Atlas để huấn luyện mô hình, trừ khi người dùng bật “bộ nhớ trình duyệt”. Tuy nhiên, vẫn còn nhiều nghi vấn về lượng dữ liệu mà hệ thống có thể thu thập từ các nội dung trả phí.
Khi các trình duyệt AI ngày càng thông minh, khả năng vượt qua các biện pháp bảo vệ truyền thống như tường phí hay chặn bot khiến ngành xuất bản kỹ thuật số đối mặt thách thức lớn. Nếu không có cơ chế giám sát và kiểm soát rõ ràng, các nhà xuất bản sẽ mất quyền kiểm soát đối với cách nội dung của họ được truy cập, sử dụng và tái tạo bởi những hệ thống AI thế hệ mới.
Đọc chi tiết tại đây: https://gbhackers.com/ai-browsers/
Được phối hợp thực hiện bởi các chuyên gia của Bkav,
cộng đồng An ninh mạng Việt Nam WhiteHat
và cộng đồng Khoa học công nghệ VnReview