“价格屠夫”DeepSeek的理想主义:开源、降本与AI普惠

6个月前 生活 44观看
摘要《科创板日报》1月28日讯 一天内登顶中美App Store免费榜、火到两天崩溃两次、Meta开设四个作战室研究,近几日以来,DeepSeek犹如一颗 “东方核弹”,引爆了全球AI圈。DeepSeek这次引发全球震动的根源之一,就是其最新发布的

《科创板日报》1月28日讯 一天内登顶中美App Store免费榜、火到两天崩溃两次、Meta开设四个作战室研究,近几日以来,DeepSeek犹如一颗 “东方核弹”,引爆了全球AI圈。c0z喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek这次引发全球震动的根源之一,就是其最新发布的开源模型DeepSeek-R1。据公司介绍,在数学、代码、自然语言推理等任务上,DeepSeek-R1性能比肩已经能OpenAI o1正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。c0z喜好网-记录每日喜好的科技时尚娱乐生活

可以说,DeepSeek和它的大模型证明了,在“大力出奇迹”的Scaling Law之外,AI大模型或许还有另一条制胜之道、一种“DeepSeek Law”:调整改变大模型的基础结构+有效利用有限资源c0z喜好网-记录每日喜好的科技时尚娱乐生活

▌“一份给全球的开源大礼”c0z喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek的很多选择都和国内的大模型创业公司不同,比如坚定选择开源路线,将代码、模型权重和训练日志全部公开,DeepSeek-R1自然也不例外。c0z喜好网-记录每日喜好的科技时尚娱乐生活

对于DeepSeek-R1,多位AI行业大佬都不乏溢美之词。c0z喜好网-记录每日喜好的科技时尚娱乐生活

“DeepSeek-R1是我见过最令人惊叹、最让人印象深刻的突破之一,而且它还是开源的,可以说是一份给全球的大礼。”顶级风投之一A16Z创始人Marc Andreesen如此形容这个模型。c0z喜好网-记录每日喜好的科技时尚娱乐生活

“我们生活在这样一个时代,一家非美国公司正在让OpenAI的初衷得以延续,即做真正开放、为所有人赋能的前沿研究。”英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是第一个展示了RL(强化学习)飞轮可发挥作用,且能带来持续增长的OSS(开源软件)项目c0z喜好网-记录每日喜好的科技时尚娱乐生活

Meta首席科学家杨立昆(Yann Lecun)则表示, “开源模型正在超越专有模型。DeepSeek从开放研究和开源中获益匪浅。他们提出了新的想法,并基于其他人的工作进行创新。由于他们的工作是公开和开源的,所有人都能从中获益。这就是开源研究和开源技术的力量。”c0z喜好网-记录每日喜好的科技时尚娱乐生活

随之而来的,是全球范围内AI技术人员们掀起的“DeepSeek复现热潮”:c0z喜好网-记录每日喜好的科技时尚娱乐生活

比如UC伯克利博士生潘家怡和两位研究人员,就在游戏CountDown中复现了DeepSeek R1-Zero。团队验证了通过RL,3B的基础语言模型也能够自我验证和搜索,成果出色。更重要的是,这项复现成本仅仅不到30美元c0z喜好网-记录每日喜好的科技时尚娱乐生活

全球最大开源平台HuggingFace团队,也已官宣复刻DeepSeek R1所有pipeline。复刻完成后,所有的训练数据、训练脚本等等,将全部开源。c0z喜好网-记录每日喜好的科技时尚娱乐生活

“在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。”DeepSeek创始人梁文锋曾这样解释选择开源的原因,“开源,发论文,其实并没有失去什么。对于技术人员来说,被follow是很有成就感的事。开源更像一个文化行为,而非商业行为……我们不会闭源。我们认为先有一个强大的技术生态更重要。”c0z喜好网-记录每日喜好的科技时尚娱乐生活

▌技术降本造就“AI价格屠夫”c0z喜好网-记录每日喜好的科技时尚娱乐生活

谈到DeepSeek大模型,另一个被常常提到的形容词,应该是“物美价廉”。c0z喜好网-记录每日喜好的科技时尚娱乐生活

最新面世的这一DeepSeek-R1,API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元,输出API价格仅仅只有OpenAI o1的3%。c0z喜好网-记录每日喜好的科技时尚娱乐生活

这不是DeepSeek第一次举起“价格屠刀”。c0z喜好网-记录每日喜好的科技时尚娱乐生活

在去年5月,DeepSeek已经带着开源第二代MoE大模型DeepSeek-V2,顶着“价格屠夫”、“AI界拼多多”的称号一炮而红——性能比肩GPT-4,但定价上每百万token输入1元、输出2元(32K上下文),仅是GPT-4的近百分之一水平。c0z喜好网-记录每日喜好的科技时尚娱乐生活

在这之后,字节跳动、百度、腾讯、阿里巴巴等互联网大厂纷纷按捺不住,纷纷官宣大模型降价,由此打响了国内大模型价格战c0z喜好网-记录每日喜好的科技时尚娱乐生活

低价背后,还是离不开“技术炫技”带来的降本。c0z喜好网-记录每日喜好的科技时尚娱乐生活

一个多月前DeepSeek-V3就曾引发业内高度关注,关键原因之一就是预训练成本之低——这个参数量高达671B的大模型,在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。与此同时,DeepSeek-V3相比其他前沿大模型,性能却足以比肩乃至更优c0z喜好网-记录每日喜好的科技时尚娱乐生活

在这背后,DeepSeek-V3采用了用于高效推理的多头潜在注意力(MLA)和用于经济训练的DeepSeekMoE。研发团队证明,多Token预测目标(Multi-Token Prediction,MTP)有利于提高模型性能,可以用于推理加速的推测解码。后训练方面,DeepSeek V3引入了一种创新方法,将推理能力从长思维链模型(DeepSeek R1)中,蒸馏到标准模型上。这在显著提高推理性能的同时,保持了DeepSeek V3的输出风格和长度控制。c0z喜好网-记录每日喜好的科技时尚娱乐生活

▌AI应用普及前奏c0z喜好网-记录每日喜好的科技时尚娱乐生活

“DeepSeek的目标是实现AGI,而不仅仅是短期的商业化。”梁文锋曾在采访中如此强调。c0z喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek的降价并非为了抢用户,而是基于成本下降和对普惠AI的追求。他相信,随着经济的发展,中国也应该成为技术创新的贡献者,而不仅仅是应用创新的跟随者。c0z喜好网-记录每日喜好的科技时尚娱乐生活

站在当下时点,AI应用渗透率仍然较低,产业仍在早期。中信证券指出,DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本,推理成本的降低,将是AI应用普及的前奏,正如4G提速降费给我国移动互联网产业提供了助力。c0z喜好网-记录每日喜好的科技时尚娱乐生活

其进一步表示,豆包pro、DeepSeek-v3等国产模型连续发布。模型能力上,国产模型在文本和知识能力上接近GPT-4、Claude、Llama等海外前沿模型水平,多模态能力逐步完备,逻辑和代码能力在非o1技术路线下达到可用水平。价格上,国产模型API百万tokens输出普遍定价10元以内,是GPT-4o的1/3甚至更低。c0z喜好网-记录每日喜好的科技时尚娱乐生活

预计模型性价比持续提升下,国内AI应用依托丰富生态和成熟流量,有望加速在各领域落地。其中,Agent模式有望以更长的任务流程、更好的场景理解、更高的自主能力,成为所有互联网用户的数字助手,在企业管理、教育、办公、金融等领域展现应用价值。c0z喜好网-记录每日喜好的科技时尚娱乐生活

值得一提的是,有消息称Meta生成AI小组和基础设施团队已开设四个作战室,学习DeepSeek工作原理。其中两个动员起来的小组正在试图了解High-Flyer如何降低训练和运行DeepSeek的成本。第三个Meta研究小组正在试图弄清楚High-Flyer可能使用哪些数据来训练其模型。第四作战室正在考虑基于DeepSeek模型属性重构Meta模型的新技术——c0z喜好网-记录每日喜好的科技时尚娱乐生活

这或许也意味着,站在巨人肩膀上的DeepSeek,成为了有望托举更多人的巨人。c0z喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
山东新起点完成2000万元A轮融资

山东新起点完成2000万元A

近日,新起点(

11-19 115阅读
英伟达Q3财报即将来袭,有多重要?美银:或决定美股反弹成败!

英伟达Q3财报即将来袭,有多

财联社11月19日讯(编辑 黄君芝)“AI总龙

11-19 95阅读
vivo Y300新机外观公布 镜头模组设计是一大亮点

vivo Y300新机外观公布 镜

vivo即将推出其新款Y300智能手机,官方

11-19 116阅读
跨境进口电商新风向:海外品牌入华为何首选抖音电商全球购?

跨境进口电商新风向:海外品

中国进口跨境电商生意蓬勃发展。公开

11-19 99阅读
《扭矩漂移2》!耕升 RTX 4080 SUPER 炫光OC燃起瞬间激情

《扭矩漂移2》!耕升 RTX 40

“昨晚,我在秋名山输给了一辆AE86,他用

11-19 96阅读
如何让一张普通夜景片变奇幻

如何让一张普通夜景片变奇

11-19 113阅读
日系清新人像后期教程

日系清新人像后期教程

11-19 104阅读
 秋冬秀发护理指南:双重呵护才是硬道理!教你应对秋冬发丝困扰

秋冬秀发护理指南:双重呵

随着秋冬季节的到来,干燥的气候不仅给

11-19 100阅读
 湾区时尚璀璨绽放,S/S 2025深圳时装周照亮潮流未来

湾区时尚璀璨绽放,S/S 202

10月26日,备受瞩目的S/S 2025深圳时装

11-19 102阅读
泰吉电子有限公司,专注电子产品零售、批发与销售

泰吉电子有限公司,专注电

紧跟科技发展脉搏的泰吉

11-19 107阅读
特朗普证实将通过宣布国家紧急状态调动美军驱逐非法移民

特朗普证实将通过宣布国家

央视

11-19 108阅读
【奋斗者笔记】燃青春演讲vlog|国门下的调车长开讲,护航口岸畅通激扬青春力量!

【奋斗者笔记】燃青春演讲

奋进“十四五”,瞻望20

11-19 100阅读
上班略痛苦

上班略痛苦

上班略痛苦。 不想上班的日子没几

11-19 100阅读
海绵宝宝被开了

海绵宝宝被开了

海绵宝宝被开了。 他含着泪:“蟹老

11-19 99阅读
乌梅泡水的功效与作用

乌梅泡水的功效与作用

功效与作用排毒清血、延缓衰老、促进消

11-19 94阅读