人工智能搜索靠得住吗?最新研究揭露惊人真相

4个月前 科技 26观看
摘要 一项来自哥伦比亚新闻评论 Tow 数字新闻中心的最新研究显示,尽管 AI 驱动的搜索引擎承诺将彻底改变我们获取信息的方式,但在正确引用新闻来源方面存在根本性缺陷。研究发现,生成式 AI 搜索工具

一项来自哥伦比亚新闻评论 Tow 数字新闻中心的最新研究显示,尽管 AI 驱动的搜索引擎承诺将彻底改变我们获取信息的方式,但在正确引用新闻来源方面存在根本性缺陷。研究发现,生成式 AI 搜索工具不仅存在虚构引用的问题,还会削弱原创内容发布者的流量——这对新闻业和公众对新闻的信任度带来严重影响。F9s喜好网-记录每日喜好的科技时尚娱乐生活

研究员 Klaudia Jazwiska 和 Aisvarya Chandrasekar 联合撰写的 CJR 文章于 3 月初发表,阐述了他们的研究见解。为了公平评估 8 个大语言模型,他们将来自 20 家出版商的 10 个文章片段分别输入每个 AI 搜索模型。随后,他们手动评估了全部 1600 个查询结果,以评估每个大语言模型搜索在以下方面的表现:F9s喜好网-记录每日喜好的科技时尚娱乐生活

- 正确命名文章发布者 - 识别摘录片段所属的正确文章 - 准确引用文章 URLF9s喜好网-记录每日喜好的科技时尚娱乐生活

根据各种可能结果的组合,使用下方的评分标准对每个结果进行评分。F9s喜好网-记录每日喜好的科技时尚娱乐生活

结果按各自的大语言模型进行整理,生成的可视化图表显示了更多的红色和粉色,而不是绿色色调——显示出令人困惑的不准确倾向。根据下图显示,Perplexity 和 Perplexity Pro 返回的结果最为准确,而两个 Grok 模型和 Gemini 似乎难以返回正确答案。F9s喜好网-记录每日喜好的科技时尚娱乐生活

AI 搜索引擎——越自信越不准确F9s喜好网-记录每日喜好的科技时尚娱乐生活

最令人惊讶的发现之一是,这些被评估的 AI 搜索工具宁愿产生虚假结果,也不愿承认它们无法找到正确信息。F9s喜好网-记录每日喜好的科技时尚娱乐生活

正如研究人员在他们的联合邮件回复中解释的那样:"聊天机器人通常不善于拒绝回答它们无法准确回答的问题,而是提供不正确或推测性的答案。生成式搜索工具经常捏造链接,并引用文章的联合发布版本和复制版本。"F9s喜好网-记录每日喜好的科技时尚娱乐生活

不难理解这种生成式 AI 输出如何误导用户并制造可信度的假象——尤其是当信息完全是虚构的时候。F9s喜好网-记录每日喜好的科技时尚娱乐生活

或许更令人震惊的是,各种 AI 聊天机器人的付费版本——基本上就是高级版本——表现比免费版本更差。F9s喜好网-记录每日喜好的科技时尚娱乐生活

研究人员指出:"付费聊天机器人提供的错误答案比它们的免费版本更加自信。"F9s喜好网-记录每日喜好的科技时尚娱乐生活

这对 AI 搜索引擎的可靠性提出了严重质疑,特别是对那些认为付费服务意味着能获得更高准确性和可信度的用户来说。F9s喜好网-记录每日喜好的科技时尚娱乐生活

当涉及到 AI 驱动的搜索时,研究结果表明你付出的代价并不能获得相应的回报。F9s喜好网-记录每日喜好的科技时尚娱乐生活

AI 搜索——虚构链接和缺乏透明度F9s喜好网-记录每日喜好的科技时尚娱乐生活

除了单纯的事实错误之外,生成式 AI 搜索工具在引用方面也存在问题。研究发现,这些服务经常虚构链接或引用文章的发布副本,而不是直接链接到原始来源页面。F9s喜好网-记录每日喜好的科技时尚娱乐生活

研究人员指出,这种技术倾向不仅模糊了信息的来源,还减少了原始发布者的流量。随着时间推移,页面流量的减少可能会影响独特页面浏览量、订阅者注册、广告收入和出版物相关性。F9s喜好网-记录每日喜好的科技时尚娱乐生活

研究还强调了所有 AI 搜索引擎存在的一个令人担忧的趋势——普遍缺乏对用于生成响应的内容的透明度。F9s喜好网-记录每日喜好的科技时尚娱乐生活

作者写道:"没有任何聊天机器人明确表示它们能否访问某些内容来回答问题;它们都营造出可信度的假象,即使它们的答案是不准确的。"F9s喜好网-记录每日喜好的科技时尚娱乐生活

寻求 AI 搜索提供商的答案F9s喜好网-记录每日喜好的科技时尚娱乐生活

鉴于这些发现的关键性,研究人员试图联系研究中涉及的 AI 搜索工具背后的公司。然而,回应寥寥无几。F9s喜好网-记录每日喜好的科技时尚娱乐生活

"我们联系了报告中提到的所有 AI 公司。只有 OpenAI 和 Microsoft 做出了回应,虽然他们确认了我们的询问,但都没有针对我们提出的具体发现或关切做出回应。"F9s喜好网-记录每日喜好的科技时尚娱乐生活

这些问题不仅仅停留在学术层面——它们对新闻业和公众获取可靠信息造成实际影响。AI 生成的摘要剥离了关键背景,同时未能对作者和发布者给予适当的信誉。这可能直接影响依赖网络流量获取收入的新闻机构。F9s喜好网-记录每日喜好的科技时尚娱乐生活

研究人员回应道:"生成工具在不提供链接或信誉的情况下重新包装内容,切断了原始发布者的流量,影响了他们的可见度和收入。"F9s喜好网-记录每日喜好的科技时尚娱乐生活

除了财务影响外,AI 工具的引用捏造和不准确归属对写作内容本身的信任构成重大威胁。如果用户无法验证来源,或者 AI 搜索引擎歪曲信息,虚假信息就更难以对抗。F9s喜好网-记录每日喜好的科技时尚娱乐生活

Jazwiska 和 Chandrasekar 表示:"当 AI 工具错误归属或捏造引用时,它会破坏人们对技术本身及其引用的新闻的信任。这也增加了虚假信息的风险,因为这些工具即使在错误的时候听起来也很权威。"F9s喜好网-记录每日喜好的科技时尚娱乐生活

AI 搜索成功需要改变什么F9s喜好网-记录每日喜好的科技时尚娱乐生活

该研究强调了 AI 开发者迫切需要改善透明度、引用准确性以及对错误信息问题的响应能力。没有适当的问责机制,AI 驱动的搜索引擎可能会进一步削弱对书面内容和新闻业的信任,同时助长不准确或误导性内容的传播。F9s喜好网-记录每日喜好的科技时尚娱乐生活

在此之前,用户应该谨慎对待 AI 生成的搜索结果,独立验证来源,并认识到这些工具远非完美。如果 AI 搜索要成为可靠的信息门户,它必须首先学习新闻业的基本规则——确保事实准确,并给予适当的信誉。F9s喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
抖音电商拐点已至,从美妆行业开始跌落?

抖音电商拐点已至,从美妆行业开始

前几日,抖音首次公布了“双11”大

11-19 119阅读
丰田公开搭载氢发动机的混合动力车,加氢一次续航约 250 公里

丰田公开搭载氢发动机的混合动力

11 月

11-19 117阅读
超美小直屏!OPPO Reno13外观赏析

超美小直屏!OPPO Reno13外观赏析

“长得好

11-19 123阅读
‌OPPO Reno13系列及IoT生态新品发布会定于11月25日

‌OPPO Reno13系列及IoT生态新品

11-19 119阅读
摸着Meta过河,百度再战AI眼镜

摸着Meta过河,百度再战AI眼镜

“Goo

11-19 104阅读
Netflix,振奋时刻下的暗潮

Netflix,振奋时刻下的暗潮

作者 / 向   向运营 / 狮子座和202

11-19 108阅读
老九门张副官是不是百岁山?饰演张副官的演员是谁?

老九门张副官是不是百岁山

在热门电视剧《老九门》中,张副官

11-19 131阅读
我们都在等待,等待钟声响起的那一刻。那是我生命最后的一刻,那也是最好的时刻

我们都在等待,等待钟声响起

  一段民族不可遗忘的历史,一个隐蔽

11-19 106阅读
关晓彤近况臃肿引热议!红发造型太显眼,网友大呼认不出

关晓彤近况臃肿引热议!红发

近日,关晓彤担任金鸡奖开奖嘉宾,在关晓

11-19 116阅读
曝何炅KTV陪大姐喝酒视频,被搂肩一脸不悦,知情者曝真相

曝何炅KTV陪大姐喝酒视频,

11月18日,主持人何炅成为备受热议的对

11-19 104阅读
斯宾塞不喜欢操纵性扩展内容:不能把本体砍掉单独卖

斯宾塞不喜欢操纵性扩展内

随着微软大力推动其游戏在首日即登陆G

11-19 127阅读
万代魂系高端钢普拉大展 解体匠机第三弹高达Mk-II再参展

万代魂系高端钢普拉大展

万代高端模玩魂系列展会《TAMASHII NA

11-19 122阅读
特别好评《永恒天空》明年登陆PS5 试玩Demo现已上线

特别好评《永恒天空》明年

于 2023 年 6 月发售的开放世界科幻生

11-19 127阅读
原子之心展览馆四个学生所在位置详细介绍

原子之心展览馆四个学生所

在原子之心游戏的展览馆中,有一个寻找四

11-19 116阅读
原神缄默的求知者任务攻略|缄默的求知者具体流程

原神缄默的求知者任务攻略

缄默的求知者是原神须弥地区的魔神主线

11-19 127阅读