AI有时错得离谱,它的逻辑与人类不同

7个月前 科技 38观看
摘要 AI犯错不如人类那样可预测且成群出现。了解其错误规律,设计专门的防护机制,才能让技术更安全地融入社会。人类每天都会犯错,从简单任务到复杂问题,错误无处不在。有些错误无伤大雅,而另一些可能导致灾难。为了

AI犯错不如人类那样可预测且成群出现。了解其错误规律,设计专门的防护机制,才能让技术更安全地融入社会。bcp喜好网-记录每日喜好的科技时尚娱乐生活

人类每天都会犯错,从简单任务到复杂问题,错误无处不在。有些错误无伤大雅,而另一些可能导致灾难。为了应对这些问题,人类花了几千年设计各种安全机制。例如,赌场定期轮换荷官,避免他们长时间工作时出错;医院会在手术前标记病人肢体,防止操作失误;甚至在会计和法律审查中,我们也建立了复杂的检查和纠错流程。bcp喜好网-记录每日喜好的科技时尚娱乐生活

如今,社会正在快速接纳一种全新的“错误制造者”——人工智能。像大型语言模型(LLMs)这样的技术在完成许多认知任务时表现出色,但它们也会犯错。而且,它们的错误与人类的完全不同。AI的错误有时会显得荒谬可笑,比如建议吃石头或在披萨上加胶水。这种“奇怪”的错误模式是人类无法预见的,因此传统的纠错方法往往无效。bcp喜好网-记录每日喜好的科技时尚娱乐生活

人类错误通常发生在知识的边缘领域,比如解高数题时出错是常见现象。这些错误通常具有聚集性和可预测性,例如疲劳或分心时更易出错。AI的错误则完全不同,它们可能随机分布在知识范围内,毫无主题可言。同样自信的回答可能是完全正确的,也可能荒谬至极。这种随机性和不稳定性使得人类难以信任AI在复杂问题上的推理能力。bcp喜好网-记录每日喜好的科技时尚娱乐生活

这揭示了两个研究方向:一是让AI的错误更接近人类,二是为AI设计专属的纠错机制。目前已经有一些方法能引导LLMs更符合人类的思维方式,比如通过人类反馈强化学习技术,让AI更倾向于生成“合理”的回答。然而,现有的纠错系统还不足以解决AI的独特问题。bcp喜好网-记录每日喜好的科技时尚娱乐生活

相比人类,AI不会感到疲惫或不耐烦,因此可以通过重复询问和合成多次回答来降低错误率。此外,一些专门的工具正在开发中,用来捕捉和分析AI在错误中展现的“奇怪逻辑”,以便更好地预防潜在风险。bcp喜好网-记录每日喜好的科技时尚娱乐生活

尽管AI的错误常被认为离谱,但某些模式其实与人类行为相似。例如,LLMs在回答问题时对提示词敏感,这和人类在问卷调查中因措辞变化而改变答案的现象如出一辙。此外,AI对常见概念的偏好可能反映了人类“可得性启发”的倾向——想到的第一个答案往往并非经过深思熟虑的结果。bcp喜好网-记录每日喜好的科技时尚娱乐生活

另一方面,AI在处理长文本时容易“中途分心”,这点也像人类。不过,训练更多样化的文本检索数据后,AI在这方面的表现已有改善。此外,研究还发现,某些人类的社交工程技巧,例如假装身份或开玩笑,竟然也能“欺骗”AI。bcp喜好网-记录每日喜好的科技时尚娱乐生活

虽然人类偶尔也会犯奇怪的错误,但这种情况少见且通常预示更严重的问题。我们通常不会让表现出随机行为的人承担决策任务。同理,AI的应用应限制在它真正胜任的领域,同时对其错误的潜在影响保持警惕。bcp喜好网-记录每日喜好的科技时尚娱乐生活

本文译自 IEEE Spectrum,由 BALI 编辑发布。bcp喜好网-记录每日喜好的科技时尚娱乐生活

bcp喜好网-记录每日喜好的科技时尚娱乐生活

bcp喜好网-记录每日喜好的科技时尚娱乐生活

bcp喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
比亚迪成全球首家达成第1000万辆新能源汽车下线车企

比亚迪成全球首家达成第1000万辆

11月1

11-19 130阅读
供应链称上游元器件要大降价:国产手机现涨价潮后会主动下调售价吗

供应链称上游元器件要大降价:国产

11月19日

11-19 128阅读
GOG 商店确保经典游戏长期兼容,首批 100 款上线

GOG 商店确保经典游戏长期兼容,首

11-19 136阅读
收到500万份垄断诉讼,谷歌要被拆分?

收到500万份垄断诉讼,谷歌要被拆

谷歌

11-19 108阅读
咖啡界“老二”闭店上百家,星巴克们开始慌了?

咖啡界“老二”闭店上百家,星巴克

星巴

11-19 110阅读
于谦因釜山行爆红, 啥梗真没想到讲相声的他竟出演过这么多作品

于谦因釜山行爆红, 啥梗真

于谦明明就是一个讲相声的人,怎么

11-19 117阅读
ENHYPEN的第二张正规专辑后续《ROMANCE:UNTOLD-daydream-》刷新了历代K-POP后续专辑中创下了最高初动销量新纪录

ENHYPEN的第二张正规专辑

18日,据Hanteo Chart榜单数

11-19 104阅读
虞书欣林一新剧演情侣,《嘘,国王在冬眠》改编自哪部小说?

虞书欣林一新剧演情侣,《嘘

12月22日是冬至,在这天,虞书欣和林

11-19 99阅读
李宇春与康姆士乐队合唱《恐龙一样勇敢》 讲述小女孩与病魔抗争的故事

李宇春与康姆士乐队合唱《

  《有歌2024》第五期,李宇春和康姆

11-19 104阅读
停播超2个月:小杨哥掉粉500万+!

停播超2个月:小杨哥掉粉500

11月15日消息,今

11-19 111阅读
《ENDER MAGNOLIA: Bloom in the Mist》将于2025年1月23日上市

《ENDER MAGNOLIA: Bloom

云豹娱乐股份有限公司(董事长兼社长:陈云

11-19 113阅读
《GTA三部曲》开发者不满名字被删 实际只修改了开场

《GTA三部曲》开发者不满

《GTA三部曲》开发商 Grove Street Ga

11-19 111阅读
360浏览器兼容模式怎么设置?360浏览器极速模式怎么开?一文看懂

360浏览器兼容模式怎么设

360浏览器是我们使用最多的一款浏览器

11-19 128阅读
原子之心展览园地下区域死者位置介绍

原子之心展览园地下区域死

原子之心游戏里面玩家可以与所有死者对

11-19 128阅读
原子之心动物谜题答案_动物谜题解谜教程

原子之心动物谜题答案_动

原子之心游戏中玩家会碰到一个动物谜题

11-19 143阅读