Cloudflare 以无关事实的无尽迷宫对抗 AI

1个月前 科技 15观看
摘要 周三,Web 基础设施提供商 Cloudflare 宣布推出一项名为"AI Labyrinth"的新功能,旨在通过向爬虫提供 AI 生成的虚假内容来对抗未经授权的 AI 数据抓取。该工具试图阻止那些未经许可爬取网站以收

周三,Web 基础设施提供商 Cloudflare 宣布推出一项名为"AI Labyrinth"的新功能,旨在通过向爬虫提供 AI 生成的虚假内容来对抗未经授权的 AI 数据抓取。该工具试图阻止那些未经许可爬取网站以收集训练数据的 AI 公司,这些数据用于训练支持 ChatGPT 等 AI 助手的大语言模型。49F喜好网-记录每日喜好的科技时尚娱乐生活

Cloudflare 成立于 2009 年,最为人所知的是为网站提供基础设施和安全服务的公司,特别是在防御分布式拒绝服务 (DDoS) 攻击和其他恶意流量方面。49F喜好网-记录每日喜好的科技时尚娱乐生活

与简单地封锁爬虫不同,Cloudflare 的新系统将它们引入一个看似真实但实际上毫不相关的页面"迷宫"中,浪费爬虫的计算资源。这种方法与大多数网站保护服务使用的标准封锁防御策略有明显不同。Cloudflare 表示,有时候封锁爬虫会适得其反,因为这会提醒爬虫操作者他们已被发现。49F喜好网-记录每日喜好的科技时尚娱乐生活

Cloudflare 写道:"当我们检测到未经授权的爬取行为时,我们不会封锁请求,而是会链接到一系列 AI 生成的页面,这些页面看起来足够真实,能够诱使爬虫遍历它们。但虽然这些内容看起来很真实,却并非我们正在保护的网站的实际内容,因此爬虫会浪费时间和资源。"49F喜好网-记录每日喜好的科技时尚娱乐生活

该公司表示,提供给爬虫的内容故意与被爬取的网站无关,但都是经过精心筛选或使用真实科学事实生成的内容——例如关于生物学、物理学或数学的中性信息——以避免传播错误信息(不过,这种方法是否能有效防止错误信息传播仍有待证实)。Cloudflare 使用其商业平台 Workers AI 服务来生成这些内容。49F喜好网-记录每日喜好的科技时尚娱乐生活

Cloudflare 将这些陷阱页面和链接设计成对普通访问者不可见且无法访问,这样浏览网页的人就不会意外遇到它们。49F喜好网-记录每日喜好的科技时尚娱乐生活

更智能的蜜罐49F喜好网-记录每日喜好的科技时尚娱乐生活

AI Labyrinth 作为 Cloudflare 所说的"下一代蜜罐"发挥作用。传统蜜罐是人类访问者看不到但解析 HTML 代码的爬虫可能会跟随的隐形链接。但 Cloudflare 表示,现代爬虫已经变得善于发现这些简单的陷阱,因此需要更复杂的欺骗手段。这些虚假链接包含适当的元指令,可以防止搜索引擎索引,同时对数据抓取爬虫保持吸引力。49F喜好网-记录每日喜好的科技时尚娱乐生活

"没有真实的人会在 AI 生成的无意义内容迷宫中深入点击四个链接,"Cloudflare 解释道。"任何这样做的访问者很可能是爬虫,因此这为我们提供了一个全新的工具来识别和标记恶意爬虫。"49F喜好网-记录每日喜好的科技时尚娱乐生活

这种识别会形成机器学习反馈循环——从 AI Labyrinth 收集的数据用于持续增强 Cloudflare 网络中的爬虫检测能力,随着时间推移不断改进客户保护。任何 Cloudflare 计划的客户——即使是免费用户——都可以通过仪表板设置中的一个开关轻松启用此功能。49F喜好网-记录每日喜好的科技时尚娱乐生活

日益严重的问题49F喜好网-记录每日喜好的科技时尚娱乐生活

Cloudflare 的 AI Labyrinth 加入了旨在对抗激进 AI 网络爬虫的工具阵营。今年 1 月,我们报道了"Nepenthes",这款软件同样将 AI 爬虫引入虚假内容的迷宫中。两种方法都共享浪费爬虫资源而不是简单封锁的核心理念。然而,虽然 Nepenthes 的匿名创建者将其描述为旨在将爬虫困住数月的"激进恶意软件",但 Cloudflare 将其工具定位为可以在其商业服务中轻松启用的合法安全功能。49F喜好网-记录每日喜好的科技时尚娱乐生活

根据 Cloudflare 的数据以及我们从各种来源听到的轶事报告,AI 爬虫在网络上的规模似乎相当可观。该公司表示,AI 爬虫每天向其网络发送超过 500 亿个请求,占其处理的所有网络流量的近 1%。许多爬虫在未经网站所有者许可的情况下收集网站数据来训练大语言模型,这种做法已引发内容创作者和出版商提起多起诉讼。49F喜好网-记录每日喜好的科技时尚娱乐生活

这项技术代表了 AI 的一个有趣的防御应用,保护网站所有者和创作者而不是威胁他们的知识产权。然而,目前尚不清楚 AI 爬虫能多快适应并避开这些陷阱,这可能迫使 Cloudflare 增加其欺骗策略的复杂性。此外,浪费 AI 公司的资源可能不会让那些批评运行 AI 模型所需能源和环境成本的人感到满意。49F喜好网-记录每日喜好的科技时尚娱乐生活

Cloudflare 将此描述为"第一次迭代",使用 AI 防御爬虫。未来计划包括使虚假内容更难被检测,并使虚假页面更无缝地集成到网站结构中。网站与数据抓取者之间的猫鼠游戏仍在继续,而 AI 现在在这场战斗的双方都得到了应用。49F喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
智己汽车携手Momenta联合打造“一段式端到端直觉智驾大模型”

智己汽车携手Momenta联合打造“

【锋巢网】10月28日,在品牌智能驾

11-19 64阅读
稳定7100MB/s!雷克沙ARES 8TB SSD评测:机箱里再也没有机械硬盘的位置了

稳定7100MB/s!雷克沙ARES 8TB SSD

一、前言:

11-19 68阅读
外媒:英伟达新款Blackwell AI芯片面临过热问题,或致数据中心部署延期

外媒:英伟达新款Blackwell AI芯片

11月1

11-19 62阅读
大模型公司们创业未半,技术主心骨们却先弃船回大厂了?

大模型公司们创业未半,技术主心骨

2024

11-19 65阅读
灵初智能完成天使轮融资

灵初智能完成天使轮融资

近日,

11-19 65阅读
丁禹兮vs范丞丞,偶像演员演技大赏

丁禹兮vs范丞丞,偶像演员演

作者 / 张   特编辑 / 阿   笔运

11-19 65阅读
脱离海马后,他们的那段故事就像是一场梦

脱离海马后,他们的那段故事

11-19 72阅读
毒铁锅 遭央视多次曝光,把美食变成 毒药 ,大家应提高警惕(遭央视多次曝光)

毒铁锅 遭央视多次曝光,把

前言 前一段时间,我国市面上出现了

11-19 66阅读
泰妍将在今天(18日)下午6点发布迷你六辑《Letter To Myself》

泰妍将在今天(18日)下午6

凭借《To. X》创造热潮的少

11-19 66阅读
中国电影海外推广研讨会在豆园(Doc.Park)举行

中国电影海外推广研讨会在

  近日,原国家广电总局电影局原巡

11-19 63阅读
与柴犬开启治愈探险之旅!异世界动作冒险新游《妖怪之国》登陆Steam

与柴犬开启治愈探险之旅!异

在这个繁忙喧嚣的现代社会,我们时常渴

11-19 73阅读
索尼正在开发自动检测游戏BUG的AI系统:简化测试流程

索尼正在开发自动检测游戏

根据 Tech4Gamer 报道,根据索尼目前发

11-19 66阅读
空洞骑士苍白矿石位置_空洞骑士苍白矿石所有位置(图片)

空洞骑士苍白矿石位置_空

《空洞骑士》是一款以探索和解谜为核心

11-19 69阅读
原神超越时间的虚影全流程解析|超越时间的虚影隐藏任务攻略

原神超越时间的虚影全流程

超越时间的虚影是原神须弥沙漠地区的隐

11-19 67阅读
饥荒通过卡猪人快速回复san值的详细操作方法

饥荒通过卡猪人快速回复sa

饥荒游戏里面玩家经常会面对san值不足

11-19 67阅读