Cloudflare 指控 Perplexity 使用隐藏爬虫窃取网站数据后，Perplexity 强力反击

网络访问大战：AI如何撕裂互联网的社会契约

旧金山—— 当Perplexity回击互联网基础设施巨头Cloudflare关于数据窃取的指控时，它不仅仅是在捍卫自身技术，更是在挑战AI驱动世界中我们对数字权利理解的根本基础。

这场对峙始于Cloudflare公开指责Perplexity部署“隐形爬虫”以规避网站限制，并记录了数百万次每日请求，声称这些请求违反了互联网长达三十年的“君子协定”。然而，Perplexity并未如预期般道歉，反而发起了猛烈反击，质疑Cloudflare的技术能力，并指责这家基础设施提供商从根本上误解了人工智能。

“这起事件表明，Cloudflare的领导层要么危险地误解了AI的工作原理，要么它就是一家华而不实的公司，”Perplexity在一份回应中宣称。这份回应将一场技术争议转变为更具深远影响的事件：一场关于数字访问、经济公平和技术进步等不同愿景的较量。

此次冲突暴露了互联网社会契约中的根本性裂痕——这些裂痕可能重塑数十亿人在线获取信息的方式。

改写叙事的反击

Perplexity的回应并未遵循常见的危机公关套路，而是展现了一种新型的企业战，它将技术复杂性武器化，不仅挑战了Cloudflare的主张，更挑战了Cloudflare提出这些主张的权威性。

这家AI公司的三管齐下式辩护，揭示了其对技术争议中“认知如何塑造现实”的深刻理解。首先，它重新定义了这场争论的整个概念基础，指出在AI助理时代，“机器人”和“用户代理”之间的传统区别已变得毫无意义。

Perplexity解释道：“当你向AI助理提出需要实时信息的问题时，它们并不知道答案。它们会为你查找信息，以完成你提出的任何任务。” Perplexity将自身技术定位为数字助理，而非自动化爬取，这与人类研究助理按需查找信息别无二致。

这种重新定义直击Cloudflare技术指控的核心。如果Perplexity的系统真如其所描述般运行——仅在响应用户查询时获取内容，即时使用，然后不存储地丢弃——那么将其定性为传统网络爬取就不只是不准确，而是概念上的混淆。

Perplexity辩护的第二个要素对Cloudflare的信誉造成了更大的损害。这家AI公司声称Cloudflare从根本上错误归因了流量，将其自身实际的请求与来自第三方浏览器自动化服务BrowserBase的请求混淆了。

根据Perplexity的分析，Cloudflare检测到每天300万至600万次请求，并将其归因于隐形爬取，而Perplexity自身的实际请求量每天不到45,000次——小了两个数量级。“由于Cloudflare方便地模糊了其方法论，并拒绝回答有助于我们团队理解的问题，我们只能将其归结为两种可能的解释，”Perplexity表示，随后发表了堪称职业性侮辱的言论：要么Cloudflare需要一次宣传噱头，要么它犯了“一个基本的流量分析错误，这对于一家以理解和分类网络流量为核心业务的公司来说，尤其令人尴尬。”

技术专长的武器化

或许最具战略意义的是，Perplexity的回应将最初的防御姿态转变为对Cloudflare核心能力的攻击性挑战。通过暗示Cloudflare无法区分合法的AI助理和真正的威胁，Perplexity不仅为自己的行为辩护，更攻击了Cloudflare商业模式的基础。

“如果你无法区分一个有用的数字助理和一个恶意的爬取器，那么你可能就不应该决定什么才是合法的网络流量，”该公司辩称。这一言论不仅在技术圈内引起共鸣，更引发了关于互联网私人治理的更广泛讨论。

这种攻击方式之所以特别有效，是因为它利用了AI系统应如何分类和监管的真正不确定性。传统的网络协议是为简单的自动化爬虫时代设计的，难以适应那些模糊了自动化和人类指导活动界限的AI助理。

技术政策分析师指出，Perplexity的回应揭示了其对这种监管真空的深刻理解。通过将自己定位为用户赋能反对企业把关的捍卫者，该公司将潜在的监管审查重新定义为一场争取创新和数字权利的战役。

一位研究技术治理争议的研究员观察到：“我们正在目睹一种新型的企业冲突解决方式。公司正越来越多地利用技术复杂性和公共叙事战，而非法律或监管程序，来解决数字权利的根本问题。”

信息提取经济学面临审视

在Perplexity的技术论点之下，是对网络传统经济模式更深层次的挑战。该公司的辩护隐含地质疑了内容创作者是否有权控制其公开可用的信息如何被访问和处理——特别是在这种处理是为了满足即时用户需求而非商业数据聚合的情况下。

这场冲突的经济层面已经开始重塑行业动态。出版商报告称，随着AI驱动的搜索工具直接提供答案而非引荐流量，其网站流量加速下滑；而网站所有者则表示，AI系统在消耗带宽的同时未能带来收入，导致资源成本不断增加。

对网络流量模式的独立分析揭示了这一转型的广度：在AI搜索工具被大量采用的市场中，小型网站的引荐流量平均下降了23%，而主要平台则保持了稳定或增长的流量。

一位追踪这些趋势的数字媒体分析师解释道：“传统的‘内容换流量’交易正在被系统性地瓦解。AI公司从内容中提取价值，却不提供几十年来支撑网络出版的经济互惠。”

然而，Perplexity的回应暗示这种框架本身已经过时，它认为AI助理通过使信息对终端用户更易获取和有用而提供了价值——这种价值是传统出版商未能通过日益杂乱、广告充斥的网站所能提供的。

技术军备竞赛加速

Cloudflare与Perplexity争议的公开性质，加速了行业观察家所称的AI公司寻求数据访问与内容提供商试图控制其信息使用之间不断升级的“技术军备竞赛”。

传统的阻断机制是为简单的网络爬虫设计的，但面对能够越来越精确地模仿人类浏览模式的复杂AI系统时，这些机制显得力不从心。一些AI公司现在采用住宅代理网络和浏览器自动化工具，使其请求几乎无法与合法用户流量区分开来。

网站防御者正以日益激进的反制措施应对。先进的指纹识别技术试图通过细微的行为模式来识别AI爬虫，而一些网站则故意向可疑AI系统提供误导性信息——这种做法被称为“数据投毒”。

一位研究AI检测系统的网络安全研究员指出：“双方的技术复杂程度都在迅速升级。我们正在看到一场将网络内容视为争议资源而非共享资源的军备竞赛正在浮现。”

这种升级产生了意想不到的后果，影响超出了争议的直接各方。学术研究人员报告称，他们的数采工具被过于激进的反AI系统阻挡，而数字无障碍倡导者则警告说，自动化阻断可能不成比例地影响依赖辅助技术的用户。

监管真空催生互联网私人治理

AI网络访问缺乏明确的法律框架，造成了监管真空，私人公司正以自身对可接受行为的解释来填补这一空白。Cloudflare决定将Perplexity从其认证机器人程序列表中移除，实际上创造了一种新的互联网私人治理形式，其中基础设施提供商决定哪些AI服务可以访问受保护的内容。

这种趋向私人监管的趋势尤其令数字权利倡导者担忧，他们认为关于信息访问的根本问题不应仅仅由企业政策来决定。欧盟已开始探索AI数据使用的综合框架，而美国几个州正在考虑立法，旨在为自动化内容访问设定更清晰的界限。

一位研究技术治理趋势的数字政策专家警告说：“我们正在目睹一个碎片化互联网的出现，其中信息访问不再取决于用户需求，而是取决于工具是否得到基础设施守门人的批准。”

法律学者认为，当前的冲突最终可能需要司法介入，特别是当网站服务条款成为限制AI访问的主要机制时——这种方法引发了关于数字空间中合同执行和用户权利的复杂问题。

数据访问战的市场影响

这场争议揭示的结构性紧张预示着技术市场可能发生的重大转变。投资者越来越多地将“数据访问风险”纳入AI公司的估值考量中，认识到监管或技术限制可能从根本上改变基于网络爬取的商业模式。

控制关键互联网基础设施的公司——从内容分发网络到域名注册商——可能会看到其平台在成为AI数据访问瓶颈时，战略价值得到提升。反之，缺乏多元数据来源或明确内容使用法律框架的AI公司则面临运营中断的日益增长风险。

早期市场迹象表明，投资者开始青睐数据获取实践更保守的AI公司，这可能重塑那些依赖网络爬取获取训练数据或实时信息访问的新兴AI初创公司的融资模式。

这场冲突也凸显了AI与网络互动替代方法中出现的新机遇。随着传统爬取在技术上变得更具挑战性或在法律上更具争议，那些开发内容市场模式的公司——即创作者因AI训练数据而获得直接报酬的模式——可能会发现需求日益增长。

迈向新的数字社会契约

随着这场冲突的持续演进，它不仅仅是一场技术或商业争议——它体现了在AI驱动的未来中，人类知识应如何组织和访问的相互竞争的愿景