Mới đây, tờ báo The New York Times (NYT) đã đệ đơn kiện OpenAI và Microsoft với cáo buộc vi phạm bản quyền khi sử dụng hàng triệu bài báo của NYT để phát triển các mô hình ngôn ngữ lớn (LLM) như ChatGPT và Copilot, đồng thời cạnh tranh trực tiếp với nội dung của The New York Times.
Theo đơn kiện, NYT cho rằng LLM của OpenAI và Microsoft có khả năng "trích dẫn trực tiếp nội dung của NYT, tóm tắt sát nội dung và mô phỏng phong cách diễn đạt" gây tổn hại nghiêm trọng đến mối quan hệ với độc giả và khiến NYT thiệt hại về doanh thu từ đăng ký, cấp phép, quảng cáo và liên kết.
Ngoài ra, đơn kiện lập luận rằng việc sử dụng các mô hình AI được huấn luyện trên nội dung của Times đe dọa đến chất lượng báo chí nghiêm túc bằng cách hạn chế khả năng bảo vệ và kiếm tiền từ nội dung của các hãng tin. Times cáo buộc: "Thông qua công cụ Bing Chat (nay đổi tên thành Copilot) của Microsoft và ChatGPT của OpenAI, hai bên bị đơn đang tận dụng khoản đầu tư khổng lồ của NYT vào lĩnh vực báo chí để xây dựng các sản phẩm thay thế mà không xin phép hoặc thanh toán."
NYT tuyên bố đã nỗ lực đàm phán với cả hai công ty trong nhiều tháng để "đảm bảo nhận được giá trị xứng đáng cho việc sử dụng nội dung của mình" nhưng không thành công. OpenAI trả lời The Verge trong một tuyên bố qua email rằng họ tôn trọng quyền của người sáng tạo nội dung và cam kết làm việc với họ để đảm bảo lợi ích từ công nghệ AI và các mô hình doanh thu mới. Microsoft hiện chưa đưa ra bình luận chính thức.
NYT yêu cầu tòa án buộc OpenAI và Microsoft phải chịu trách nhiệm với "hàng tỷ đô la thiệt hại" vì làm việc vi phạm bản quyền và yêu cầu cấm hai công ty sử dụng nội dung của Times để huấn luyện các mô hình trí tuệ nhân tạo, đồng thời xóa các tác phẩm của Times khỏi bộ dữ liệu của họ.
Vụ kiện của NYT đánh dấu một bước ngoặt quan trọng trong mối quan hệ giữa các hãng tin và trí tuệ nhân tạo. Trong khi nhiều đơn vị như BBC, CNN và Reuters đã chặn công cụ thu thập dữ liệu của OpenAI để bảo vệ nội dung của mình, một số khác đã tìm cách hợp tác. Axel Springer, công ty sở hữu Politico và Business Insider, vừa ký thỏa thuận cho phép ChatGPT khai thác thông tin trực tiếp từ hai nguồn này, và Associated Press cũng cho phép OpenAI huấn luyện các mô hình của mình trên các bài báo của họ trong 2 năm tới.
'Hộp đen' của OpenAI: Khởi nghiệp thành công, huy động vốn lớn, được định giá 86 tỷ USD nhưng lại đăng ký là tổ chức phi lợi nhuận, báo cáo doanh thu vượt quá 1 tỷ đô la vào năm 2022.