o3模型智商157,比肩爱因斯坦!AI只用7个月,超过人类100年

4个月前 科技 29观看
摘要图片来源:由无界AI生成根据OpenAI公布的数据显示,新模型o3在Codeforces上的评级为2727,比全球99.8%程序员都要好。如果转化为智商大约在157,历史上的爱因斯坦还能与AI较量一下。他没有正式测试过智商,但外界普遍认为其智商


qK7喜好网-记录每日喜好的科技时尚娱乐生活

图片来源:由无界AI生成图片来源:由无界AI生成

根据OpenAI公布的数据显示,新模型o3在Codeforces上的评级为2727,比全球99.8%程序员都要好。qK7喜好网-记录每日喜好的科技时尚娱乐生活

如果转化为智商大约在157,历史上的爱因斯坦还能与AI较量一下。他没有正式测试过智商,但外界普遍认为其智商在160以上。qK7喜好网-记录每日喜好的科技时尚娱乐生活

虽然AI还没有情商,只论智商的话,目前人类已经无法看到AI的追尾灯了。qK7喜好网-记录每日喜好的科技时尚娱乐生活

其实,OpenAI今年发布GPT-4o时智商也只有115,属于正常人范围。o1预览版模型达到了123,相当于博士级水平。从完整版的o1开始达到惊人的135,o3mini则突破140大关。qK7喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI只用了短短7多个月的时间,就把AI的智商足足提升了42分。qK7喜好网-记录每日喜好的科技时尚娱乐生活

如果按照Flynn Effect效应的智商进化论来看,人类想把智商提升42分的话,大约需要140年才能完成qK7喜好网-记录每日喜好的科技时尚娱乐生活

Flynn Effect效应是在1983年首次系统性提出来的,主要揭示了智力测试得分的变化规律,也帮助人们重新思考智力的本质及其受到的影响因素。qK7喜好网-记录每日喜好的科技时尚娱乐生活

调查显示,在不同人群和年龄组中具有一致性,无论是发达国家还是发展中国家,不同种族和年龄的个体都观察到了智商的增长,主要影响智商增长的因素包括,营养改善、教育质量提高、健康条件改善、家庭规模减小、认知刺激增加等社会性原因。qK7喜好网-记录每日喜好的科技时尚娱乐生活

平均而言,每10年人类的智商普遍会增加3分左右qK7喜好网-记录每日喜好的科技时尚娱乐生活

另外一个能体现高智商的就是做数学测试题。根据OpenAI发布的测试数据显示,o3模型在美国AIME 2024数学竞赛的成绩达到了恐怖的96.7qK7喜好网-记录每日喜好的科技时尚娱乐生活

大幅度超过预览版o1模型,几乎秒杀了GPT-4o的13.4。o3模型相当于全球最顶级的数学家。qK7喜好网-记录每日喜好的科技时尚娱乐生活

不少网友看到o3模型智商表也相当震惊,感觉自己的智商要被AI嘲笑了。qK7喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI这是要搞一个爱因斯坦大脑计划啊。qK7喜好网-记录每日喜好的科技时尚娱乐生活

o1模型在门萨测试中获得了133分。所以,我认为这个智商估算表格是完全正确的!qK7喜好网-记录每日喜好的科技时尚娱乐生活

重要的是,o3模型的推理对合成学习数据非常有益。但当涉及到AGI时,这也被描述为‘奇点’,即技术增长变得无法控制的一个时间点。qK7喜好网-记录每日喜好的科技时尚娱乐生活

爱因斯坦的智商也只有160而已啊~qK7喜好网-记录每日喜好的科技时尚娱乐生活

157智商可能就是人类史上最聪明的人了。要是200+就得做另外那一桌了~qK7喜好网-记录每日喜好的科技时尚娱乐生活

在o3的基准分数发布后,人们的恐惧是真实存在的。但由于AI革命可能在未来4年内数据短缺,我们在接下来1年内能取得的成就看起来不太确定。然而,人类的能力似乎已经被AI超越了。qK7喜好网-记录每日喜好的科技时尚娱乐生活

目前,o3模型还处于安全测试阶段,不敢想全面公测之后有多爽,人手一个爱因斯坦,各种家教的饭碗怕是不保了,最起码竞争会比现在激烈的多。同时很多困扰人类几十年甚至上百年的数学、物理难题都可能得到解决。qK7喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 大模型
展开全文
猜你感兴趣
今年双11大变样,淘宝京东不卷了!

今年双11大变样,淘宝京东不卷了!

在被电商平台造出的第16个年头,双

11-19 69阅读
宇瞻发布NOX RGB DDR5电竞内存条,速度高达8000MT/s

宇瞻发布NOX RGB DDR5电竞内存条

11-19 76阅读
大厂离职博主,卷向海外

大厂离职博主,卷向海外

离开

11-19 64阅读
“知春路时代”的创业者,被回购条款绊了一跤

“知春路时代”的创业者,被回购条

这次

11-19 69阅读
中银300亿母基金加速推进

中银300亿母基金加速推进

银行

11-19 68阅读
丁禹兮vs范丞丞,偶像演员演技大赏

丁禹兮vs范丞丞,偶像演员演

作者 / 张   特编辑 / 阿   笔运

11-19 65阅读
陶喆深夜送美女回家, 疑似再次出轨遭经纪人否认!

陶喆深夜送美女回家, 疑似

陶喆也算是家喻户晓的歌星了,曾经

11-19 66阅读
《号手就位》主角为什么都选择入伍,最后他们如何了?

《号手就位》主角为什么都

《号手就位》是中国首部火箭军题

11-19 61阅读
张晚意新剧《我知道我爱你》今日开播,他化身宠物医生

张晚意新剧《我知道我爱你

12月25日,张晚意的新剧《我知道我

11-19 67阅读
扎导又拍新片

扎导又拍新片

扎克·施

11-19 67阅读
每年冠军纪录,九号品牌见证AG成就电竞传奇

每年冠军纪录,九号品牌见证

11月16日,KPL年度总决赛决赛在万众瞩目

11-19 65阅读
《ENDER MAGNOLIA: Bloom in the Mist》将于2025年1月23日上市

《ENDER MAGNOLIA: Bloom

云豹娱乐股份有限公司(董事长兼社长:陈云

11-19 70阅读
原子之心电脉冲枪怎么用?原子之心电脉冲枪用不了的解决办法

原子之心电脉冲枪怎么用?

原子之心电脉冲枪怎么用?电脉冲枪是原子

11-19 71阅读
原神缄默的求知者任务攻略|缄默的求知者具体流程

原神缄默的求知者任务攻略

缄默的求知者是原神须弥地区的魔神主线

11-19 68阅读
饥荒通过卡猪人快速回复san值的详细操作方法

饥荒通过卡猪人快速回复sa

饥荒游戏里面玩家经常会面对san值不足

11-19 68阅读