Reddit数据大反转:‘人民阵线’贩卖‘人民’数据

作者
Peperoncini
9 分钟阅读

Reddit的数据策略大反转

想象一下,你建立了一个全球言论自由的公共议事厅,却在邻居登门拜访时开始收取门票。这就是Reddit在AI时代上演的最新变数。

纽约—— 设想一下:Reddit,这个人们倾吐心事、交流梗图、激辩不休的喧嚣网络市集,突然像个醋意大发的门卫,严防死守。这个曾经主张开放交流的平台,刚刚与谷歌和OpenAI等AI巨头签下巨额协议,将自己宝贵的用户互动数据拱手相让。而现在呢?它却起诉一家竞争对手,理由是对方未经许可获取了同样的数据。

Reddit在曼哈顿法庭上对Perplexity发起了大胆攻势,后者是一家能够快速提供答案的AI新星。诉讼猛烈抨击Perplexity进行了一场Reddit所谓的“大规模数字盗窃”。Reddit声称,这家初创公司,与一个鬼鬼祟祟的爬虫公司网络联手,绕过Reddit的防护墙,攫取了多年的帖子和评论,而这些正是训练智能机器人的原始燃料。

然而,深入探究,你会发现一个令人玩味的讽刺,它恰好概括了我们这个充满漏洞的网络时代。Reddit曾自诩为互联网喧嚣的前廊,靠着志愿用户贡献的未经雕琢的原始宝藏而蓬勃发展。然而,它如今却挥舞着拳头,声称这些宝藏并非人人可享的免费果实,而是精明卖家手中的优质商品。你懂的:一家公司的付费合作,可能就是另一家公司的彻头彻尾的诈骗,即使两者都以惊人相似的方式炮制出模仿人类智慧的AI。分歧何在?在于真金白银,而非所谓的“巧妙意图”。

抛开关于版权或像《数字千年版权法案》(DMCA)这类陈旧法律的细枝末节不谈——这场争斗预示着AI地盘战中更大的震荡。精明的律师和经验丰富的董事会成员私下表示,这是一场旨在摧毁支撑AI繁荣的地下“数据清洗”勾当的权力游戏。Reddit不只针对Perplexity;它还将同伙一并拖入泥潭——想想立陶宛的Oxylabs、德克萨斯州的SerpApi,甚至还有与俄罗斯旧机器人网络有关的神秘公司AWMProxy。这就像是烧毁了整个黑市管道,而不仅仅是最终买家。

Reddit的信息清晰明了:不能再不付钱就从互联网的无尽宝库中随意获取。入场费不菲,没得商量。而且,他们有证据支持这种强硬立场。

“引蛇出洞”策略

Reddit并非只依靠冠冕堂皇的说辞。他们的起诉书描绘了一场狡猾的猫鼠游戏。早在五月,他们就曾向Perplexity发出严厉的“停止侵权”通知。盗用行为减少了吗?没有。事实上,Perplexity回复中提及Reddit内容的情况反而激增,仿佛是对警告的蔑视。

于是,Reddit的技术专家们设计了一个经典的计策,简直是从间谍惊悚片中搬来的。他们设置了一个“蜜罐陷阱”——在谷歌的某个角落偷偷植入了一个虚假帖子,将其与外界的窥探隔离开来。砰。几个小时后,Perplexity在答案中“吐”出了这个帖子的内容。这就是铁证:证明Perplexity是通过中间代理进行偷偷摸摸的绕行,而非“礼貌性地”查看。

Perplexity以“高尚”姿态反击,高举着“开放网络”的大旗——这正是几十年前点燃Reddit火花的初衷。他们声称尚未看到相关文件,但誓言在提供事实的同时,捍卫“开放和公共利益”。这是一场信仰的冲突:知识是奔腾不息的河流,还是有围墙的蓄水池?但问题是:Reddit的“修补围墙”热潮,恰恰是在巨额利润滚滚而来之后才开始的,其中最引人注目的是今年二月与谷歌达成的一项,据传每年高达6000万美元的协议。

一位眼光敏锐的数据交易员一语道破玄机:“他们在大数据资源中划出了一道断裂线。像谷歌或OpenAI一样付费,你就是合法的;吝啬不给,你就是恶棍。同样的材料,同样的手段——只是少了银行到账的提示音。”

攻破数据壁垒

在法律层面,Reddit避开了那些由AI引发的、棘手的抄袭主张——那些令法官头疼的“合理使用”迷雾。相反,他们转而聚焦于《数字千年版权法案》(DMCA)中严厉的反规避条款。争议点不在于窃取内容;而在于撬开大门去获取这些内容。

长期以来,法院对突破数字护城河(如验证码迷宫或防火墙)的行为一直持惩罚态度。这比“是否借用过多”的争论清晰得多。通过聚焦于Perplexity所谓的规避行为——无视robots.txt的“禁止入内”标志,通过代理蜂巢进行伪装——Reddit将争论从模糊的概念层面拉回到具体的黑客行为。

如果能赢得初步禁令,其涟漪效应可能会席卷全球各地的AI实验室。对于任何未经许可就大肆攫取网络原始数据的机器人来说,成本将飙升;风险倍增。突然之间,从尘封的剪辑库和图片社,到专业的学术期刊和代码社区,这些“守门人”都将拥有真正的谈判筹码。他们将为自己人类创造的知识(AI渴望的生命线)进行艰苦的谈判。拥有铁证主张和坚固壁垒的大平台将从中获利;而那些曾将开放网络视为“合法游戏”的草根程序员们呢?他们将陷入困境。

这场对决将重新界定网络世界的狂野前沿。一方是Reddit,一个“无政府主义”的产物;另一方是Perplexity,向大众兜售智慧。悬而未决的是什么?是我们的数字洪流——数以亿计的妙语、图片和灵感。它们是集体智慧的共同遗产,还是未来引擎的优质原油,任由最富有的操纵者开采?

当这些诉讼文件堆满那座“哥谭”式的法院时,真正的书写者——那些二十年来在Reddit上讨论英雄、分享欢笑、分担悲伤、编织社群的普通Reddit用户——却只能作为旁观者。他们的集体心声是什么?原来,这里是“黄金地段”。现在每个人都在想:这笔意外之财最终会落入谁的口袋?

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯

我们网站使用Cookie来启用某些功能,为您提供更相关的信息并优化您在我们网站上的体验。更多信息请参阅我们的 隐私政策 和我们的 服务条款 。强制性信息可在 法律声明