OpenAI宣布o3系列大模型:能力较o1大幅提升 Codeforces测试强于OpenAI首席科学家

8个月前 科技 45观看
摘要 12月21日消息,据外媒报道,在发布o1满血版、视频生成模型Sora等之后,OpenAI连续12天的直播活动在当地时间周五进入了最后1天,他们在当天的发布会上宣布了更强的o3系列人工智能模型。同第1天、第3天和第5天的直

12月21日消息,据外媒报道,在发布o1满血版、视频生成模型Sora等之后,OpenAI连续12天的直播活动在当地时间周五进入了最后1天,他们在当天的发布会上宣布了更强的o3系列人工智能模型。Wck喜好网-记录每日喜好的科技时尚娱乐生活

同第1天、第3天和第5天的直播一样,OpenAI CEO 萨姆·奥尔特曼(Sam Altman)也参与了他们第12天的直播,o3系列大模型也是由他在直播中宣布的。Wck喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI在9月份推出了o1系列大模型,他们周五推出o3系列,在命名上就越过了o2,没有遵循数字一样的连续命名方式。对于越过o2,有外媒在报道中称可能是为了避免和英国电信运营商O2在命名上产生纷争。而在当天的直播中,萨姆·奥尔特曼承认了他们在命名上的不足,他表示基于OpenAI不太擅长命名的传统,新的大模型被命名为o3。Wck喜好网-记录每日喜好的科技时尚娱乐生活

同9月份推出的o1系列大模型一样,OpenAI新宣布的o3系列大模型也有o3和o3 mini两款,不过尚未正式发布,o3 mini是预计会在明年年初发布。Wck喜好网-记录每日喜好的科技时尚娱乐生活

在OpenAI此前推出的大模型中,能力在持续提升,新宣布的o3系列也不例外。Wck喜好网-记录每日喜好的科技时尚娱乐生活

从OpenAI方面公布的消息来看,o3大模型在测试中的表现明显强于他们之前推出的大模型,在部分测试中的表现已经达到了人类的水平。Wck喜好网-记录每日喜好的科技时尚娱乐生活

在ARC-AGI测试中,o3在低推理能力设置下的得分达到了75.7%,是o1的3倍,在高推理能力设置下则是高达87.5%,超过了85%的人类门槛。Wck喜好网-记录每日喜好的科技时尚娱乐生活

在数学推理及解决问题的能力方面,o3也表现不俗,在2024年AIME测试中,o3的准确率达到了96.7%。Wck喜好网-记录每日喜好的科技时尚娱乐生活

在编码和软件工程方面,o3的能力较o1也有大幅提升,在SWE-Bench认证中,o3的得分为71.7%,较o1提升了22.8个百分点。Wck喜好网-记录每日喜好的科技时尚娱乐生活

值得注意的是,有外媒在报道中提到,在Codeforces的测试中,o3的得分为2727,比OpenAI首席科学家的得分还高。Wck喜好网-记录每日喜好的科技时尚娱乐生活

虽然OpenAI的o3系列大模型要在明年才会正式发布,但他们在官网已表示,安全研究人员可以申请用于测试,从当地时间周五开始接受申请,截止时间为明年1月10日。Wck喜好网-记录每日喜好的科技时尚娱乐生活

Wck喜好网-记录每日喜好的科技时尚娱乐生活

Wck喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
雷军再回应小米SU7 Ultra车模难抢:行业自动化程度较低,产能严重不足

雷军再回应小米SU7 Ultra车模难

11 月

11-19 120阅读
比亚迪造出的第一款实车“316”亮相,王传福称第二天就砍掉了

比亚迪造出的第一款实车“316”

11 月

11-19 131阅读
看懂小米2024年Q3财报:史上强 手握现金1516亿元

看懂小米2024年Q3财报:史上强 手

11月18日

11-19 115阅读
93亿并购,“弟弟”成了“爹”

93亿并购,“弟弟”成了“爹”

11月1

11-19 116阅读
郎酒大战夜郎古,一个字2亿元

郎酒大战夜郎古,一个字2亿元

不是

11-19 115阅读
雷佳音:再获金鸡影帝,拥抱四美台上哽咽,不忘向张艺谋要手机号

雷佳音:再获金鸡影帝,拥抱四

11-19 127阅读
天生戏剧人!小演员田芯语乌镇首秀,领衔戏剧节唯一入围儿童剧《乐园》

天生戏剧人!小演员田芯语乌

  深秋,一场淅淅沥沥的小雨为江南带

11-19 112阅读
要钱干嘛!比尔盖茨支持对富豪加税:我愿放弃62%的财富

要钱干嘛!比尔盖茨支持对富

11月11日消息,据

11-19 104阅读
苦等七年终于来了!《白夜破晓》长丰集结海报出炉:潘粤明主演

苦等七年终于来了!《白夜破

11月17日消息,时

11-19 99阅读
《最后生还者》新季明年春首播

《最后生还者》新季明年春

HBO及HBO Max首

11-19 110阅读
木内ラムネ作品《月のお気に召すまま》在别册玛格丽特完結

木内ラムネ作品《月のお気

木内ラム

11-19 127阅读
LUIDA’S BAR推出《DQIII》合作菜单

LUIDA’S BAR推出《DQIII

为纪念HD-

11-19 125阅读
经典游戏重制合集《FATE: Reawakened》将登陆主机

经典游戏重制合集《FATE:

游戏发行商gamigo、WildTangent以及开

11-19 135阅读
和平精英国际服怎么选择国家?和平精英国际服改国籍方法

和平精英国际服怎么选择国

《和平精英国际服》是蓝洞和腾讯联合出

11-19 207阅读
饥荒无消耗驯服猪人的详细操作方法

饥荒无消耗驯服猪人的详细

猪人是饥荒游戏里面的特殊生物,因为数量

11-19 117阅读