国产AI“三英”战OpenAI:DeepSeek、月之暗面、MiniMax相继上新 战况如何?

3个月前 生活 25观看
摘要《科创板日报》1月21日讯(编辑 宋子乔) OpenAI的GPT系列身后,国产大模型正紧追不舍。1月20日,DeepSeek正式发布DeepSeek-R1,并同步开源模型权重。据介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数

《科创板日报》1月21日讯(编辑 宋子乔) OpenAI的GPT系列身后,国产大模型正紧追不舍。1lK喜好网-记录每日喜好的科技时尚娱乐生活

1月20日,DeepSeek正式发布DeepSeek-R1,并同步开源模型权重。据介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。1lK喜好网-记录每日喜好的科技时尚娱乐生活

根据其公布的测试数据,DeepSeek-R1在美国AIME 2024、MATH-500和SWE-bench Verified测试中的比分均高于OpenAI o1(小K注:前两个测试专注于数学能力,SWE-bench Verified旨在评估AI模型解决现实世界软件问题的能力)。1lK喜好网-记录每日喜好的科技时尚娱乐生活

image1lK喜好网-记录每日喜好的科技时尚娱乐生活

同一天,Kimi全新SOTA模型——k1.5多模态思考模型上线在long-CoT模式下,Kimi k1.5的数学、代码、多模态推理能力,也达到长思考SOTA模型OpenAI o1正式版的水平。官方表示,这应该是全球范围内,OpenAI之外的公司首次实现o1正式版的多模态推理性能。Kimi技术团队第一次准备了详细的技术报告。1lK喜好网-记录每日喜好的科技时尚娱乐生活

在short-CoT模式下,Kimi k1.5的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,领先达到550%。1lK喜好网-记录每日喜好的科技时尚娱乐生活

image1lK喜好网-记录每日喜好的科技时尚娱乐生活

image1lK喜好网-记录每日喜好的科技时尚娱乐生活

其他国产大模型同样表现出色,1月15日,MiniMax发布全新开源模型系列Minimax-01,在多个标准和内部基准测试中,Minimax-01的性能与GPT-4o、Claude3.5-Sonnet等顶尖模型相当,尤其在长上下文处理方面表现突出。1lK喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI分别在2024年5月、9月和12月发布了GPT-4o、GPT-o1(包括o1-preview和o1-mini,o1正式版推迟到2024年12月发布)和GPT-o3,目前最强大的模型是o3,具备出色的推理能力、科学知识掌握更优秀、编码能力更强。1lK喜好网-记录每日喜好的科技时尚娱乐生活

o1紧随其后,擅长编码、数学和写作,其多模态功能支持图片上传,允许它将推理应用于视觉,以获得更详细、更有用的回复。1lK喜好网-记录每日喜好的科技时尚娱乐生活

以DeepSeek为代表的国产大模型团队力图在性能上比肩最先进的大模型,定价则展示了极致性价比。1lK喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中);每百万输出tokens 16元。1lK喜好网-记录每日喜好的科技时尚娱乐生活

与之对比,GPT-o1模型每百万输入tokens 15美元(约合人民币110元);每百万输出tokens 60美元(约合人民币438元)。OpenAI目前最便宜的模型是GPT-4o mini,其定价为每百万输入Tokens 10美元(约合人民币73元);每百万输出tokens 20美元(约合人民币146元)。1lK喜好网-记录每日喜好的科技时尚娱乐生活

国产大模型呼唤国产算力

国内外大模型厂商你追我赶,短时间内迅速迭代,意味着大模型厂商对算力的需求仍在继续增加。1lK喜好网-记录每日喜好的科技时尚娱乐生活

火山引擎智能算法负责人吴迪此前曾表示,字节跳动综合考虑算力资源储备、市场未来用量、模型成本下降等因素判断,2027年豆包每天Token消耗量会超过100万亿,将是现在的100倍以上。1lK喜好网-记录每日喜好的科技时尚娱乐生活

1月20日消息称,据芜湖市生态环境局官网,字节跳动(抖音集团)旗下芜湖江东名邑科技有限公司拟在安徽芜湖建设火山引擎长三角算力中心项目,项目环境影响评价文件近日获受理,并正在实施批前公示。该项目总投资80亿元,设计服务器机柜数为21824台,网络机柜236台,一座220kV变电站。1lK喜好网-记录每日喜好的科技时尚娱乐生活

此前有消息称,小米正在搭建自己的GPU万卡集群,并对AI大模型进行大规模投资。1lK喜好网-记录每日喜好的科技时尚娱乐生活

东莞证券此前表示,未来,随着字节、幻方、小米等国内厂商积极布局AI领域,国产大模型有望快速崛起,推动国产算力需求增长,促进国产算力基础设施建设,我国国产算力产业链有望迎来发展机遇。1lK喜好网-记录每日喜好的科技时尚娱乐生活

上海证券也发布研报称,以字节为代表的国产大模型崛起,以及小米等玩家的入局,有望拉动国内互联网大厂在算力端的支出,国内算力军备竞赛刚刚开始,国产算力厂商迎来发展机遇。1lK喜好网-记录每日喜好的科技时尚娱乐生活

东方证券表示,算力建设持续性至关重要,在此背景下,服务器及液冷厂商、PCB厂商等有望受益。此外,数据存力和运力需求的持续攀升,为存储、光模块和光芯片等企业创造了更多的市场机会,促使整个产业链不断优化升级,以满足日益增长的AI算力需求。1lK喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
千呼万唤始出来,华为Mate 70系列开启预订!黑科技、原生鸿蒙有望“非凡”亮相

千呼万唤始出来,华为Mate 7

《科创板日报》11月18日讯(记者 黄心怡)

11-19 63阅读
从第一件天然皮草开始,守住我们人生的多样和多元!

从第一件天然皮草开始,守住

位于上海徐汇滨江、由建筑大师张永和

11-19 65阅读
红魔10 Pro系列电池达7050mAh,厚度仅8.9mm

红魔10 Pro系列电池达7050

作为红魔方面即将于11月13日推出的新

11-19 65阅读
商家案例丨华润万家:中秋联名营销,华润万家&抖音联名卡结合职人扫码直播齐发力,季度支付突破3亿

商家案例丨华润万家:中秋联

「生活服务1001」是抖音生活服务出品

11-19 61阅读
iOS 18.2 测试版“查找”应用新功能支持的航空公司公布

iOS 18.2 测试版“查找”

这将使航空公司更容易帮助寻找带有 A

11-19 67阅读
日系清新人像后期教程

日系清新人像后期教程

11-19 70阅读
吉克隽逸同款|意大利DUOMONDI多曼尼蓝牙音响究竟如何?

吉克隽逸同款|意大利DUOMO

当众人仍在探索如何活出自我的道路时

11-19 70阅读
品类案例速递|小红书童装童鞋夏日高光案例合集

品类案例速递|小红书童装

带你走入奢侈品与服饰行业的潮流前线

11-19 64阅读
新任品牌大使苏有朋,空降劲霸男装武汉「汉月交叠领」系列发布会

新任品牌大使苏有朋,空降

2024年10月19日,劲霸男装第四届茄克节

11-19 68阅读
最新登上诺奖殿堂的microRNA,原来自然堂已经研究了近10年!

最新登上诺奖殿堂的microR

最近2024年诺贝尔生理学或医学奖重磅

11-19 61阅读
乱港分子戴耀廷因串谋颠覆国家政权罪被判入狱10年

乱港分子戴耀廷因串谋颠覆

央视

11-19 72阅读
文旅新探|探寻川西“秘境”稻城亚丁:一片净土 一卷诗画

文旅新探|探寻川西“秘境”

“有一个美丽的地方,传

11-19 66阅读
买甜筒遇到暑假工

买甜筒遇到暑假工

买甜筒遇到暑假工。 然后…… 我

11-19 65阅读
上了大学

上了大学

从来没觉得妈妈做饭难吃。 直到上

11-19 62阅读
树莓的功效与作用

树莓的功效与作用

功效与作用助阳明目、止血、抑菌消炎1

11-19 63阅读