Các thương hiệu truyền thông trực tuyến hy vọng một giao thức mới sẽ ngăn chặn AI Crawlers không mong muốn

Các thương hiệu truyền thông trực tuyến, bao gồm Yahoo, Quora và Medium, đang thực hiện một bước mới để ngăn các công ty AI sao chép và sử dụng nội dung của họ để đào tạo các mô hình mà không cần sự cho phép của họ.

Các nhà xuất bản, bao gồm cả công ty mẹ của CNET Ziff Davis, xem công cụ mới này, được gọi là RSL, như một cách khác để đảm bảo các nhà phát triển AI lớn không sử dụng công việc của họ mà không thanh toán hoặc bồi thường – một vấn đề đã dẫn đến một loạt các vụ kiện.

RSL, viết tắt của việc cấp phép thực sự đơn giản, được lấy cảm hứng từ Syndication thực sự đơn giản, một tiêu chuẩn web lâu năm cung cấp các bản cập nhật nội dung cập nhật và tự động ở định dạng có thể đọc được máy tính. Giống như RSS, RSL được mở, phi tập trung và có thể hoạt động với khá nhiều nội dung trực tuyến, bao gồm các trang web, video và bộ dữ liệu.

Xem cái này: IPhone Air mới thay đổi trò chơi cho các bộ phận

05:34

Ngay bây giờ, khi robot internet lưu động của một công ty AI, được gọi là trình thu thập thông tin, muốn hút thông tin trên một trang web, nó phải đi qua robot.txt, hoạt động như một mục nhập cơ bản hoặc không nhập. Các công ty AI đã tìm ra cách xung quanh robot.txt hoặc bỏ qua hoàn toàn và sau đó đã bị kiện. Mục tiêu của RSL là trở thành một lớp công nghệ mạnh mẽ hơn để đối phó với các trình thu thập dữ liệu AI, hiện chiếm hơn một nửa lưu lượng truy cập Internet. .

“RSL xây dựng trực tiếp dựa trên di sản của RSS, cung cấp lớp cấp phép bị thiếu cho Internet đầu tiên AI”, Tim O’Reilly, CEO của O’Reilly Media, cho biết trong một thông cáo báo chí. “Nó đảm bảo rằng những người sáng tạo và nhà xuất bản thúc đẩy sự đổi mới của AI không chỉ là một phần của cuộc trò chuyện mà còn khá bù đắp cho giá trị mà họ tạo ra.”

Các thương hiệu đã ký hợp đồng với RSL bao gồm Reddit, People, Internet Brand, Fastly, Wikihow, O’Reilly, Daily Beast, The MIT Press, Miso, Adweek, Ranker, Evolve Media và Raptive.

“Nếu AI được đào tạo về tác phẩm của các nhà văn của chúng tôi, thì nó cần phải trả tiền cho công việc đó”, Giám đốc điều hành trung bình Tony Stubblebine nói trong một thông cáo báo chí. “Ngay bây giờ, AI chạy theo nội dung bị đánh cắp. Áp dụng tiêu chuẩn RSL này là cách chúng tôi buộc các công ty AI đó phải trả tiền cho những gì họ sử dụng, ngừng sử dụng nó hoặc đóng cửa.”

Sự ra đời của RSL đến khi lưu lượng truy cập web trực tuyến đã gây ra những thay đổi đối với Google và sự ưu tiên của AI. Các câu trả lời do AI tích hợp của Google tạo ra ở đầu tìm kiếm của Google đã bị các nhà xuất bản chỉ trích khi lấy đi những cú nhấp chuột tiềm năng mà họ sẽ nhận được. Google cho rằng tổng quan AI gửi “nhấp chuột chất lượng cao hơn” đến các trang web, những người tham gia nhiều hơn và ở lại các trang web lâu hơn. AI chatbots như Chatgpt cũng giúp nghiên cứu và tổng hợp, có nghĩa là mọi người không phải nhảy xung quanh các trang web khác nhau để tập hợp các mẩu thông tin giống như cách họ đã làm trước đây. Nhìn chung, các nhà xuất bản đang mất tới 25% lưu lượng truy cập do nền tảng AI, theo một báo cáo từ Infactory.

“Việc áp dụng rộng rãi tiêu chuẩn RSL sẽ bảo vệ tính toàn vẹn của công việc ban đầu và tăng tốc một khung cùng có lợi cho các nhà xuất bản và nhà cung cấp AI,” Giám đốc điều hành của Ziff Davis, Vivek Shah.

Đáp lại, các nhà xuất bản đang kiện các công ty AI hoặc giao dịch cấp phép. Trong các trường hợp khác, các trang web đang chuyển sang các dịch vụ như Tollbit, nhằm mục đích tính phí trình thu thập dữ liệu AI mỗi khi họ yêu cầu kiểm tra nội dung của trang web. Các mạng phân phối nội dung như Cloudflare, giúp đảm bảo mọi người truy cập nhanh vào các trang web trực tuyến, đang chặn các trình thu thập thông tin hoàn toàn.

Người đồng sáng lập RSL Eckart Walther cho biết tiêu chuẩn RSL và những nỗ lực như thế của Cloudflare là bổ sung, với nhiều công ty truyền thông tương tự tham gia vào cả hai. Walther đã so sánh các công cụ như CloudFlare với Bouncers bảo vệ một trang web khỏi các trình thu thập thông tin không mong muốn, trong khi RSL chỉ cho phép trình thu thập thông tin hiểu các quy tắc và giá nhập học. “Các phương thức bồi thường này cũng có thể làm việc cùng nhau. Ví dụ, một nhà xuất bản có thể muốn tính phí để thu thập nội dung của họ, và sau đó cũng yêu cầu thanh toán tiền bản quyền mỗi khi nội dung được sử dụng bởi mô hình AI để trả lời câu hỏi”, Walther nói trong email gửi cho CNET.

Công nghệ, Tin tức

Các thương hiệu truyền thông trực tuyến hy vọng một giao thức mới sẽ ngăn chặn AI Crawlers không mong muốn

admin

Để lại một bình luận Hủy