:quality(75)/web_co_he_thong_moi_buoc_cac_cong_ty_ai_phai_tra_phi_noi_dung_24cf3fc20d.jpg)
Web có hệ thống mới buộc các công ty AI phải trả phí nội dung
Mới đây, một loạt thương hiệu lớn như Reddit, Yahoo, Medium, Quora và People Inc. đã chính thức công bố ủng hộ Really Simple Licensing (RSL), một tiêu chuẩn cấp phép nội dung mở được kỳ vọng sẽ thay đổi cách các công ty AI khai thác dữ liệu từ web.
Khác với robots.txt vốn chỉ cho phép website lựa chọn cho phép hoặc từ chối bot, RSL bổ sung thêm lớp điều khoản bản quyền và phí bản quyền ngay trong file robots.txt. Điều này giúp nhà xuất bản trực tuyến không chỉ kiểm soát cách bot và hệ thống AI sử dụng dữ liệu mà còn có thể nhận phí từ việc khai thác này. Ngoài văn bản, tiêu chuẩn cũng cho phép gắn điều khoản cấp phép vào sách điện tử, video hay tập dữ liệu huấn luyện.
Ai đứng sau RSL Standard
Dự án được dẫn dắt bởi tổ chức RSL Collective với sự tham gia của Eckart Walther, đồng sáng tạo chuẩn RSS và cựu CEO CardSpring, cùng Doug Leeds, cựu CEO của IAC Publishing và Ask.com. Walther cho biết mục tiêu của RSL là tạo ra một mô hình kinh doanh bền vững cho web, kế thừa tinh thần từ RSS và bổ sung hạ tầng mới, nơi quyền cấp phép và bồi thường được xác định rõ ràng trên toàn Internet.
RSL hỗ trợ nhiều mô hình cấp phép khác nhau, từ miễn phí đến trả phí. Chủ website có thể lựa chọn thu phí theo lượt truy cập bot, thu phí theo lượt tham chiếu dữ liệu khi mô hình AI sử dụng thông tin để sinh câu trả lời hoặc áp dụng mức phí thuê bao định kỳ cho các công ty AI. Điểm đáng chú ý là các bot phục vụ mục đích tìm kiếm hoặc lưu trữ vẫn có thể hoạt động bình thường mà không chịu phí.

Trong bối cảnh nhiều công ty truyền thông lớn như Vox Media, News Corp hay The New York Times phải đàm phán riêng lẻ với OpenAI, Amazon và các ông lớn AI khác, RSL giúp đơn giản hóa quá trình này. Với RSL, mọi website, từ cá nhân đến doanh nghiệp, đều có thể được trả phí mà không cần ký từng hợp đồng riêng biệt. Leeds ví von rằng nếu một AI vi phạm, họ sẽ phải đối mặt không chỉ với một tờ báo mà là cả tập thể các nhà xuất bản, tương tự sức mạnh pháp lý của các tổ chức bản quyền trong ngành âm nhạc.
RSL bản thân không trực tiếp chặn bot. Để giải quyết, RSL Collective đã hợp tác với Fastly, một mạng phân phối nội dung lớn, nhằm xây dựng vai trò “người gác cửa”, chỉ cho phép bot AI đã đăng ký và trả phí truy cập website. Nếu một website không dùng Fastly, họ vẫn có thể yêu cầu trả phí qua RSL nhưng chưa thể chặn bot trực tiếp cho đến khi có thêm nhiều nhà cung cấp hạ tầng hỗ trợ.
Thách thức lớn nhất hiện tại nằm ở khía cạnh pháp lý. Việc AI thu thập dữ liệu công khai để huấn luyện vẫn ở trong vùng xám của luật bản quyền, và nhiều vụ kiện đang diễn ra như Reddit và Getty Images kiện các công ty AI vì hành vi sử dụng dữ liệu không phép. Tuy nhiên, Leeds tin rằng RSL có thể trở thành nền tảng pháp lý vững chắc trong tương lai, giống như cách ngành âm nhạc vận hành với các tổ chức ASCAP hay BMI.
Ngoài Reddit, Yahoo, Quora và wikiHow, RSL Collective còn có sự góp mặt của O’Reilly Media, Ziff Davis (chủ sở hữu IG) và People Inc. Đặc biệt, việc tham gia RSL hoàn toàn miễn phí cho các nhà xuất bản và nhà sáng tạo.
RSL được kỳ vọng sẽ trở thành tiêu chuẩn chung cho toàn bộ Internet, mang lại cơ chế công bằng khi các công ty AI phải trả phí để khai thác trí tuệ tập thể của nhân loại. Leeds khẳng định họ không phát minh bánh xe mới, mà chỉ mang bánh xe đến nơi nó chưa từng xuất hiện trước đây. RSL chính là hạ tầng giúp ngành công nghiệp nội dung trực tuyến vận hành giống như những gì đã diễn ra trong lĩnh vực truyền thông và âm nhạc.
Xem thêm:
- Spotify chính thức ra mắt âm thanh lossless cho người dùng Premium
- Grammarly mở rộng hỗ trợ ngôn ngữ Tây Ban Nha và Pháp tới người dùng toàn cầu
Nguồn: The Verge
:quality(75)/estore-v2/img/fptshop-logo.png)