分析称Grok3成本是DeepSeek的263倍 消耗了20万块英伟达GPU

6个月前 游戏 27观看
摘要 新浪科技报道,北京时间2月18日12点30分左右,马斯克与xAI团队的另外三位技术负责人,一同发布了公司最新推出的Grok-3基座大模型。短短30分钟的发

新浪科技报道,北京时间2月18日12点30分左右,马斯克与xAI团队的另外三位技术负责人,一同发布了公司最新推出的Grok-3基座大模型。TpT喜好网-记录每日喜好的科技时尚娱乐生活

TpT喜好网-记录每日喜好的科技时尚娱乐生活

TpT喜好网-记录每日喜好的科技时尚娱乐生活

TpT喜好网-记录每日喜好的科技时尚娱乐生活

短短30分钟的发布过程中,马斯克及其团队向大家介绍了Grok-3比DeepSeek-V3、OpenAI-4o等更为突出的数学、科学推理性能,演示了大模型代码创作能力,同时也公布了后续的开源计划。TpT喜好网-记录每日喜好的科技时尚娱乐生活

强大的模型性能背后,Grok-3的训练成本也成了备受关注的一个焦点。TpT喜好网-记录每日喜好的科技时尚娱乐生活

据马斯克在直播中披露,Grok 3在训练过程累计消耗了20万块英伟达GPU,训练在xAI公司的数据中心完成。有马斯克团队人员介绍称,“我们花了122天才完成了第一个10万卡训练,但我们并没有就此止步,如果我们想要构建巨型人工智能,需要立即将集群的大小增加一倍。”TpT喜好网-记录每日喜好的科技时尚娱乐生活

相较于DeepSeek以远低于同行“1/20的成本”训练出比肩OpenAI-01模型能力的R1模型,Grok-3的这一算力消耗属实不小。就在马斯克公布Grok-3训练成本后,很快便有人员分析指出,“Grok-3的算力消耗是DeepSeek-v3的263倍,中国的模型团队只得望洋兴叹。”TpT喜好网-记录每日喜好的科技时尚娱乐生活

当全球范围内越来越多的企业都开始选择使用更加低成本的AI大模型时,昔日的AI大模型机构们,也不得不放低姿态,开始拥抱市场。对于Grok-3而言,高昂的训练成本及不开源的策略,或许将成为阻碍其普及的一大关键。TpT喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
20年后焕发新生 《半条命2》在线玩家人数冲上巅峰

20年后焕发新生 《半条命2

根据SteamDB的数据显示,围绕《半条命2

11-19 139阅读
redhat安装教程,虚拟机红帽子linux安装教程(保姆级)

redhat安装教程,虚拟机红

redhat是一款非常棒的操作系统,想要学习

11-19 127阅读
烟雨江湖千机遗迹怎么开启?烟雨江湖千机遗迹攻略流程

烟雨江湖千机遗迹怎么开启

《烟雨江湖》是一款开放世界武侠冒险手

11-19 218阅读
饥荒san值怎么恢复?饥荒恢复san值的途径一览

饥荒san值怎么恢复?饥荒恢

san值是饥荒游戏里面的一个重要数值,玩

11-19 116阅读
饥荒暖石制作方法详细介绍

饥荒暖石制作方法详细介绍

暖石是饥荒游戏里面的一个特殊道具,可以

11-19 189阅读
比演唱会门票还难抢!暑假伊始,家长上演“课本去哪儿”

比演唱会门票还难抢!暑假伊

暑假刚开始,对不

07-11 29阅读
38岁天津北漂男子下班后住车里近3年:不比住酒店差

38岁天津北漂男子下班后住

“我是2022年买

07-12 25阅读
青春筑梦双百,实践绽放芳华,广东二师阳西工作站总结汇报会举行

青春筑梦双百,实践绽放芳华

7月17日,广东青

07-22 26阅读
00后男子拒服兵役,受11项惩戒

00后男子拒服兵役,受11项惩

近日,黑龙江大庆

07-29 22阅读
【视频】李雨霏:因热爱小动物结缘生物专业,我在苏黎世联邦理工继续追光|我有我young

【视频】李雨霏:因热爱小动

人物档案李雨霏

08-01 17阅读
智己汽车携全新智己LS6、智己L6登陆2024广州车展

智己汽车携全新智己LS6、

11月15日消息,今日,智己汽车携两款“超级

11-19 132阅读
降价也不灵?汽车流通协会会长:供需失衡是导致“价格战”的根本原因

降价也不灵?汽车流通协会会

11-19 121阅读
吉利星愿外有颜值,内有安全

吉利星愿外有颜值,内有安全

吉利星愿(参数|询价)的外形设计独

11-19 110阅读
2024广州车展,全新智己LS6、智己L6大进化!锁定“20万元级纯电最优选”

2024广州车展,全新智己LS6

今日,智己汽车携两款“超级爆品”-

11-19 124阅读
2024广州车展:星途星纪元E08全新设计打造豪华MPV“样板间”

2024广州车展:星途星纪元E0

【2024广州车展】在星途品牌早先发

11-19 131阅读