马斯克旗下xAI发布Grok 3 自称超越GPT-4o、DeepSeek-v3

6个月前 科技 33观看
摘要 2月18日消息,今日,马斯克旗下人工智能公司xAI发布了大模型Grok 3。在大模型能力方面,在数学推理、科学逻辑推理和代码写作上,Grok-3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的

2月18日消息,今日,马斯克旗下人工智能公司xAI发布了大模型Grok 3。r1A喜好网-记录每日喜好的科技时尚娱乐生活

在大模型能力方面,在数学推理、科学逻辑推理和代码写作上,Grok-3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。r1A喜好网-记录每日喜好的科技时尚娱乐生活

在AIME'24数学能力测试中,Grok-3取得了52分,明显高于DeepSeek-V3的39分。r1A喜好网-记录每日喜好的科技时尚娱乐生活

在GPQA科学知识评估中,Grok-3以75分的优异成绩领先DeepSeek-V3的65分。r1A喜好网-记录每日喜好的科技时尚娱乐生活

此外,在LCB Oct-Feb编程能力测试中,Grok-3也以57分的成绩超越了DeepSeek-V3的36分。r1A喜好网-记录每日喜好的科技时尚娱乐生活

据xAI官方介绍,Grok 3 在训练过程调用了 10 万个 Nvidia H100芯片,较前代产品 Grok 2 使用的 15000 个 GPU 实现了数倍的跨越式提升。(御风)r1A喜好网-记录每日喜好的科技时尚娱乐生活

r1A喜好网-记录每日喜好的科技时尚娱乐生活

r1A喜好网-记录每日喜好的科技时尚娱乐生活

r1A喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
‌华为、OPPO、vivo、小米联手打造统一链接平台:简化App下载流程‌

‌华为、OPPO、vivo、小米联手打

11-19 131阅读
《无限暖暖》12月5日全球公测

《无限暖暖》12月5日全球公测

11-19 111阅读
中银300亿母基金加速推进

中银300亿母基金加速推进

银行

11-19 109阅读
国家级基金、江苏省级母基金押注人形机器人

国家级基金、江苏省级母基金押注

近日,

11-19 117阅读
“一听别人说‘清华系’,我就感觉压力山大”

“一听别人说‘清华系’,我就感觉

自从

11-19 106阅读
9年前,那个娶了泰国“最尤物妖”的北京夫君,如今后悔了吗

9年前,那个娶了泰国“最尤

11-19 109阅读
《号手就位》主角为什么都选择入伍,最后他们如何了?

《号手就位》主角为什么都

《号手就位》是中国首部火箭军题

11-19 116阅读
韩钢琴家任奫灿荣膺法国年度金音叉奖

韩钢琴家任奫灿荣膺法国年

韩国钢琴家任奫灿荣获法国权

11-19 101阅读
微念称与李子柒的案件已完全和解:账号其本人运营 品牌由微念经营

微念称与李子柒的案件已完

11月13日消息,日

11-19 126阅读
《角斗士2》横扫国际票房

《角斗士2》横扫国际票房

《角斗士2》在欧

11-19 106阅读
《优米雅的鍊金工房》第二波情报,新宣传片公开

《优米雅的鍊金工房》第二

活着, 就会不断地累积记忆。这是她在灭

11-19 109阅读
《战神:诸神黄昏》6.001补丁发布 优化手柄和显卡支持

《战神:诸神黄昏》6.001补

《战神:诸神黄昏》6.001更新版本着重解

11-19 114阅读
帝国时代2高清版秘籍,帝国时代2高清重制版(HD版)秘籍

帝国时代2高清版秘籍,帝国

帝国时代2高清版是最近很多玩家在玩的

11-19 122阅读
原子之心展览园啁啾表位置_展览园所有啁啾表所在位置一览

原子之心展览园啁啾表位置

啁啾表是原子之心游戏里面的一个特殊收

11-19 135阅读
饥荒制作刷肉机快速刷肉的详细操作方法

饥荒制作刷肉机快速刷肉的

大肉是饥荒游戏里面的重要食物,主要是猪

11-19 122阅读