苹果炮轰AI推理模型:全是假思考!再多算力也没用

2个月前 游戏 10观看
摘要 苹果近日发表了一篇研究论文,称推理模型全都没真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一

苹果近日发表了一篇研究论文,称推理模型全都没真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。

mui喜好网-记录每日喜好的科技时尚娱乐生活

mui喜好网-记录每日喜好的科技时尚娱乐生活

为了更客观测试推理模型的推理能力,他们设计了4类谜题环境:汉诺塔、跳棋交换、过河问题、积木世界,并且这4类谜题的难度可以精确控制。mui喜好网-记录每日喜好的科技时尚娱乐生活

随着问题变难,推理模型初始会延长思考,但随后思考深度反而下降,尽管仍有充足token预算,它们却在最需要深入思考时选择了放弃。并且,当问题复杂度继续增加并超过某个临界点时,无论是推理模型还是标准模型都会经历完全的性能崩溃,准确率直线下降至零。mui喜好网-记录每日喜好的科技时尚娱乐生活

mui喜好网-记录每日喜好的科技时尚娱乐生活

mui喜好网-记录每日喜好的科技时尚娱乐生活

对此,有网友讽刺到:“苹果拥有最多的资金,2年了也没有拿出像样的成果,现在自己落后了,却来否定别人的成果。”mui喜好网-记录每日喜好的科技时尚娱乐生活

据悉,Apple Intelligence在2024年WWDC正式亮相,在这一年里,苹果宣传中的许多功能都经历延期、不够完善甚至被下架。不过也有人指出,这篇论文没有看上去那么消极,而是呼吁设立更好的推理机制和评估办法。mui喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
《星刃》开发商否认《胜利女神》将改编动画的传言

《星刃》开发商否认《胜利

《星刃》对于开发商Shift Up而言是一

11-19 121阅读
奥特曼格斗进化0怎么放大招?奥特曼格斗进化0攻略

奥特曼格斗进化0怎么放大

《奥特曼格斗进化0》游戏中可以操控各

11-19 149阅读
原神终将到来的花神诞祭任务流程|终将到来的花神诞祭任务攻略

原神终将到来的花神诞祭任

终将到来的花神诞祭是原神须弥地区魔神

11-19 154阅读
原神缄默的求知者任务攻略|缄默的求知者具体流程

原神缄默的求知者任务攻略

缄默的求知者是原神须弥地区的魔神主线

11-19 123阅读
饥荒中毒了怎么解毒?饥荒解除中毒状态的详细操作方法

饥荒中毒了怎么解毒?饥荒

饥荒中毒了怎么解毒?在饥荒游戏中玩家偶

11-19 124阅读
小孩哥炒菜、转锅秀翻网友:“这孩子有出息”

小孩哥炒菜、转锅秀翻网友

暑期来临,在结束

07-14 19阅读
警惕“客服兼职”诈骗陷阱!高中生打了20分钟电话 警察却上门了→

警惕“客服兼职”诈骗陷阱

暑假期间,不少学

07-22 18阅读
校园配餐首个国家标准发布!

校园配餐首个国家标准发布

记者21日从市场

07-22 19阅读
“神兽”归家怎么办 这个地方自有妙计

“神兽”归家怎么办 这个

机器人齿轮转动

07-29 15阅读
男子出国时买下侵华日军罪证实物,赠予安徽革命军事馆,当事人:想告诉大家和平不是白捡的

男子出国时买下侵华日军罪

7月30日上午,41

08-01 12阅读
仅需2619元 这款RTX 3060显卡好价促销(仅需2619元这款RTX3060显卡好价促销)

仅需2619元 这款RTX 3060

前段时间,铭瑄RTX 3060 iCraft OC 12

11-19 122阅读
光遇 换完圣诞礼,你们还有多少蜡烛,0根来得及复刻吗(光遇换完圣诞礼)

光遇 换完圣诞礼,你们还有

光遇:换完圣诞礼,你们还有多少蜡烛,0根

11-19 120阅读
我们向上,中国向前!五菱携手央视举办致敬奋斗者大会,点燃国民奋斗新活力

我们向上,中国向前!五菱携手

11月18日晚,上汽通用五菱承时代之召

11-19 114阅读
问界新M5亮相广州车展,这份购车指南请收好!

问界新M5亮相广州车展,这份

11月15日,第22届广州国际车展盛大开

11-19 125阅读