Nvidia đã bị kiện, và việc sử dụng vi phạm bản quyền để đào tạo các mô hình lớn đã trở thành một quy tắc bất thành văn trong ngành?

The Kings · 16:00

Gần đây, Nvidia trở thành bị đơn trong một vụ kiện tập thể liên quan đến bản quyền dữ liệu đào tạo AI, phản ánh căng thẳng ngày càng lớn giữa ngành trí tuệ nhân tạo và hệ thống bảo hộ quyền tác giả. Nguyên đơn là năm nhà văn sở hữu các tác phẩm đã đăng ký bản quyền, cáo buộc Nvidia sử dụng sách lậu từ các “thư viện bóng tối” để huấn luyện mô hình ngôn ngữ lớn thế hệ mới thông qua framework NeMo Megatron.

Vụ kiện được nộp lên Tòa án Quận Bắc California. Ngày 31/01/2026, Nvidia đệ trình kiến nghị yêu cầu bác đơn, cho rằng nguyên đơn không đủ bằng chứng và việc sử dụng dữ liệu của hãng thuộc phạm vi “sử dụng hợp lý”. Phiên điều trần được ấn định vào ngày 02/04/2026.

Theo cáo trạng, áp lực cạnh tranh từ OpenAI và làn sóng mô hình lớn sau thành công của ChatGPT đã khiến Nvidia đẩy nhanh việc ra mắt các mô hình mới trước hội nghị nhà phát triển năm 2023. Các tài liệu nội bộ bị dẫn lại cho thấy Nvidia từng tìm cách mua quyền dữ liệu sách từ các nhà xuất bản nhưng thất bại, sau đó chuyển sang tiếp cận các “thư viện bóng tối” như Anna’s Archive. Chỉ trong vòng một tuần, ban lãnh đạo Nvidia đã phê duyệt hợp tác, qua đó được quyền truy cập tốc độ cao vào khoảng 500TB dữ liệu sách lậu.

Ngoài Anna’s Archive, Nvidia còn bị cáo buộc sử dụng dữ liệu từ The Pile, một bộ dữ liệu phổ biến trong giới AI, trong đó tập con Books3 chứa khoảng 190.000 cuốn sách có nguồn gốc từ Bibliotik. Cáo trạng cho rằng với quy mô đào tạo của các mô hình như Nemotron-4 15B, Nvidia cần tới hàng triệu cuốn sách và khó có thể đạt được con số này nếu không dựa vào tài nguyên vi phạm bản quyền. Nvidia cũng bị tố đã cung cấp công cụ và tập lệnh giúp khách hàng tải xuống và xử lý các bộ dữ liệu có vấn đề về bản quyền.

Nvidia không phải trường hợp cá biệt. OpenAI, Meta, Anthropic, xAI và nhiều công ty AI khác cũng đang vướng vào các vụ kiện tương tự. Năm 2025, Anthropic đồng ý chi ít nhất 1,5 tỷ USD, tương đương khoảng 38 nghìn tỷ VNĐ, để dàn xếp một vụ tranh chấp bản quyền, có khả năng trở thành khoản bồi thường lớn nhất lịch sử lĩnh vực này. Các phán quyết gần đây của tòa án Mỹ cho thấy xu hướng thận trọng: việc sử dụng tác phẩm có bản quyền để huấn luyện AI có thể được coi là “sử dụng hợp lý” trong một số trường hợp, nhưng hành vi cố ý tải xuống và lưu trữ sách lậu quy mô lớn vẫn tiềm ẩn rủi ro pháp lý nghiêm trọng.

Làn sóng kiện tụng đang đặt ra câu hỏi cốt lõi cho ngành AI: nhu cầu dữ liệu khổng lồ để đào tạo mô hình lớn có thể tiếp tục dựa vào các “thư viện ngầm”, hay ngành này buộc phải chuyển sang con đường cấp phép chính thức với chi phí cao hơn. Câu trả lời nhiều khả năng sẽ định hình lại trật tự kinh tế và pháp lý của trí tuệ nhân tạo trong những năm tới.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Nvidia đã bị kiện, và việc sử dụng vi phạm bản quyền để đào tạo các mô hình lớn đã trở thành một quy tắc bất thành văn trong ngành?

The Kings

Writer

The Kings

Sony rút khỏi thị trường đầu ghi đĩa Blu-ray

Ông chủ khoe khoang nhất Trung Quốc đã xuất hiện

Một số chính phủ châu Âu đang cân nhắc từ bỏ hoàn toàn phần mềm của Mỹ

Gã khổng lồ công nghệ duy nhất "ngược dòng" trong cuộc đua đốt tiền nghìn tỷ cho hạ tầng AI

Thăm nhà máy sản xuất máy hút ẩm Lumias, Sharp và Delonnghi

Tập đoàn Trung Quốc được chỉ định tham gia 3 tuyến đường sắt tỷ USD tại Việt Nam

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Startup Nga biến bồ câu thành thiết bị do thám sống bằng công nghệ cấy ghép não bộ

Đánh giá nổi bật