因AI企业从存档抓取数据,Reddit禁止互联网档案馆对非首页索引

因AI企业从存档抓取数据,Reddit禁止互联网档案馆对非首页索引

文章来源:智汇AI    发布时间:2025-08-14

Reddit 允许企业付费抓取 AI 所需的数据,但经由互联网档案馆间接访问显然绕过了这一规定。

暂无访问
感谢智汇AI网友Nuc_F的线索投递!

智汇AI8月13日消息,参考外媒TheVerge当地时间11日报道,海外大型社区论坛Reddit宣布禁止互联网档案馆(InternetArchive)对该论坛非首页的绝大多数页面进行索引存档。

Reddit发言人在向媒体解释这一变化时表示,这是因为一些AI企业以违反平台政策的方式通过互联网档案馆的存档页面抓取该企业数据。Reddit允许企业付费抓取AI所需的数据,但经由互联网档案馆间接访问显然绕过了这一规定。

互联网档案馆旗下网页时光机(WaybackMachine)总监在声明中表示,该组织与Reddit有着长期合作关系,并正继续就此事持续展开讨论。

相关阅读:

《Reddit起诉AI初创公司Anthropic:去年7月以来发起超10万次违规访问》

《RedditCEO:微软等公司必须付费才能抓取数据》

相关推荐