Công cụ OpenAI bị hãng truyền thông chặn - Bí quyết tìm kiếm nội dung trang web ngày càng hiệu quả

Công cụ OpenAI bị hãng truyền thông chặn - Bí quyết tìm kiếm nội dung trang web ngày càng hiệu quả

Các hãng truyền thông ngày càng chặn công cụ của OpenAI để quét nội dung trang web, gây trở ngại trong việc thu thập dữ liệu

Công cụ OpenAI bị hãng truyền thông chặn - Bí quyết tìm kiếm nội dung trang web ngày càng hiệu quả

Biểu tượng OpenAI và ChatGPT. Ảnh: AFP/TTXVNCác tờ báo New York Times, CNN và đài ABC của Australia, cùng các hãng tin Reuters và Bloomberg đã thực hiện biện pháp để cản trở GPTBot - một công cụ quét trang web được ra mắt vào ngày 8/8. Trước đó, các tập đoàn truyền thông của Pháp như France 24, RFI, Mediapart, Radio France và TF1 cũng đã áp dụng các biện pháp tương tự. Sibyle Veil, Chủ tịch đài phát thanh Radio France, đã khẳng định rằng họ sẽ không chấp nhận bất kỳ hoạt động "đạo" thông tin trái phép nào.

Theo Originality.ai - một trang web giám sát sự sáng tạo, gần 10% trong số 1.000 trang web hàng đầu trên thế giới đã từ chối GPTBot chỉ sau 2 tuần từ khi công cụ này được phát hành. Các trang web như Amazon.com, Wikihow.com, Quora.com và Shutterstock đều đã chặn truy cập từ GPTBot. Đội ngũ Originality.ai tin rằng danh sách các trang web ngăn chặn GPTBot sẽ tiếp tục tăng dần, với tốc độ tăng trưởng là 5% mỗi tuần.

OpenAI thông báo trên trang web chính thức rằng cho phép GPTBot tiếp cận các trang web sẽ cải thiện độ chính xác, năng lực và độ an toàn tổng thể của các mô hình AI. Tuy nhiên, OpenAI cũng cung cấp hướng dẫn để chặn công cụ này nếu các chủ trang web không muốn cho phép GPTBot truy cập.

Các công cụ AI như ChatGPT, DALL-E 2 (dùng để sáng tạo hình ảnh), Stable Diffusion và Midjourney ngày càng trở nên phổ biến từ năm 2022 nhờ khả năng sáng tạo nội dung dựa trên văn bản đầu vào được cung cấp. Tuy nhiên, các công ty đứng sau các công cụ này như OpenAI và Stability AI đã phải đối mặt với các vụ kiện liên quan đến việc vi phạm bản quyền tác phẩm từ các tác giả, nghệ sĩ.