为什么DeepSeek必须开源

6个月前 科技 38观看
摘要 DeepSeek的开源策略让它在市场上获得立足点,但这并不意味着OpenAI就会被淘汰。OpenAI依旧是行业领头羊,开源模式的崛起只会激发更多创新。现在大家应该都听说过DeepSeek了。它是那个训练出R1开源推理模型的

DeepSeek的开源策略让它在市场上获得立足点,但这并不意味着OpenAI就会被淘汰。OpenAI依旧是行业领头羊,开源模式的崛起只会激发更多创新。BbO喜好网-记录每日喜好的科技时尚娱乐生活

现在大家应该都听说过DeepSeek了。它是那个训练出R1开源推理模型的中国AI实验室,R1的表现与OpenAI的o1不相上下,但它是用较为普通的硬件,以极低的成本完成训练的。BbO喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek之所以能够做到这一点,是因为它采用了一种创新的训练方法,比OpenAI、Anthropic以及其他资金雄厚的竞争者使用的训练方式更高效。那么,为什么DeepSeek会选择开源呢?BbO喜好网-记录每日喜好的科技时尚娱乐生活

从表面上看,这似乎违背了所有商业课本中教的常识:如果你通过创新打造了一个市场领先的产品,而且成本低廉,你应该利用这一优势进行盈利。可口可乐不会把自己的配方开源,对吧?BbO喜好网-记录每日喜好的科技时尚娱乐生活

但在大型语言模型(LLM)的世界里,这种做法并不罕见。我相信DeepSeek几乎不得不选择开源,随着时间的推移,开源模型将变得越来越主流。BbO喜好网-记录每日喜好的科技时尚娱乐生活

为什么DeepSeek必须开源BbO喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek的情况十分特殊。作为一家中国公司,它可能让一些企业在与其合作时感到不安,尤其是在涉及客户数据时,更别提需要遵守HIPAA或SOC2认证的情况了。BbO喜好网-记录每日喜好的科技时尚娱乐生活

中国的AI API在西方市场可能会受到怀疑,但开源模型则能立刻建立信任。自己托管或通过像Together AI这样的AI供应商使用开源模型,你完全可以掌控一切。BbO喜好网-记录每日喜好的科技时尚娱乐生活

为了在西方市场站稳脚跟,DeepSeek不得不将其模型开源。但这不仅仅是一个经济决策,它也是一种文化决策。最近我听到一句话:“开源不仅仅是一种技术行为,它也是一种文化行为。”BbO喜好网-记录每日喜好的科技时尚娱乐生活

开源公司(至少在初期)必须做到以小博大。正是因为DeepSeek必须面对出口控制问题,无法使用像Nvidia H100和GB10等先进芯片,它才不得不找到更高效的训练模型的方式。BbO喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI、Meta、Google等公司拥有数十亿美元的资金、庞大的计算资源和世界级的分发渠道。它们不需要寻找更高效的模型训练方式,因为它们的昂贵解决方案就是唯一选择。事实上,如果能够让LLM的构建更容易且更便宜,这反而会削弱它们的竞争优势。BbO喜好网-记录每日喜好的科技时尚娱乐生活

然而,这一切已经发生了变化。BbO喜好网-记录每日喜好的科技时尚娱乐生活

模型的商品化BbO喜好网-记录每日喜好的科技时尚娱乐生活

现在几乎每周都有新发布的GPT-4级别的LLM。我在使用的AI应用中,根本分不清我到底是在使用LLaMa、GPT、Claude还是Mistral模型。从我的个人经验和基准测试来看,它们的表现几乎不相上下。BbO喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI依旧是行业的领导者。它们是首个发布推理模型的公司,也是首个发布GPT-4的公司。但如今,模型正在逐渐商品化,值得思考的是,是否值得为OpenAI API支付高额费用,尤其是在开源模型已经有了很好的表现时。BbO喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek或许就是这个现象最典型的例子。OpenAI的o1每百万输出标记收费60美元,而DeepSeek的R1通过Together AI平台,每百万输出标记仅需7美元。BbO喜好网-记录每日喜好的科技时尚娱乐生活

如果最终用户根本无法察觉两者的差异,那为什么要付出更多呢?尤其在基础设施领域,这一点尤为重要。BbO喜好网-记录每日喜好的科技时尚娱乐生活

基础设施领域,开源最终胜出BbO喜好网-记录每日喜好的科技时尚娱乐生活

使用开源和专有软件之间往往存在一个权衡:开源软件便宜且更具可定制性,但由于需要自己维护,它会占用更多资源,并且需要一定的技术知识。而专有软件则更贵,但提供了更顺畅(尽管更僵化)的体验。BbO喜好网-记录每日喜好的科技时尚娱乐生活

对于很多产品类别来说,这种权衡并不值得大多数公司去做。你不想因为自托管的Notion替代品出现故障而丢失所有的知识库。BbO喜好网-记录每日喜好的科技时尚娱乐生活

然而,基础设施总是定制的,它始终需要你的参与。即便是专有的Oracle数据库,也需要大量的工作来设置和维护。这也是为什么开源数据库越来越受欢迎的原因。BbO喜好网-记录每日喜好的科技时尚娱乐生活

专有软件的优势(不需要维护、不需要技术知识等)在基础设施领域的作用远不如其它领域。实际上,情况正好相反:越是技术性强的产品,越适合用户(工程师)使用开源软件,因为他们可以审核代码库。BbO喜好网-记录每日喜好的科技时尚娱乐生活

这也是我们选择将Lago作为开源公司构建的原因。我们知道,无论你是自己构建,还是选择供应商,计费系统都会变得非常复杂,工程师们更倾向于使用Lago。BbO喜好网-记录每日喜好的科技时尚娱乐生活

LLM也一样。要构建任何有用的产品,你无论如何都要进行大量的定制化提示和工程调整,那不如选择DeepSeek的R1,而不是OpenAI的o1。BbO喜好网-记录每日喜好的科技时尚娱乐生活

这也是为什么开源基础设施公司那么多,而开源消费品公司几乎没有成功的原因。BbO喜好网-记录每日喜好的科技时尚娱乐生活

这意味着专有AI已经结束了吗?不。BbO喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI远未过时BbO喜好网-记录每日喜好的科技时尚娱乐生活

关于DeepSeek的R1或其他开源模型会让OpenAI过时的说法,完全不准确。首先,OpenAI一直是市场的领先者,无论是在LLM(如GPT-4)还是推理模型(如o1)上。BbO喜好网-记录每日喜好的科技时尚娱乐生活

没有OpenAI的模型,就没有DeepSeek的R1和许多其他模型(因为LLM的蒸馏技术)。这确实引发了一个问题,那就是,如果你提供了突破性的技术,而其他公司以更低的价格推出类似的产品,那么构建新的前沿模型是否仍然值得呢?BbO喜好网-记录每日喜好的科技时尚娱乐生活

不过,R1也可能会促使那些资金雄厚的老牌公司重新审视自身的效率,并推动他们寻找更高效的方式,谁知道当他们同时拥有效率和世界一流的资源时,会创造出什么呢?BbO喜好网-记录每日喜好的科技时尚娱乐生活

本文译自 Lago Blog,由 BALI 编辑发布。BbO喜好网-记录每日喜好的科技时尚娱乐生活

BbO喜好网-记录每日喜好的科技时尚娱乐生活

BbO喜好网-记录每日喜好的科技时尚娱乐生活

BbO喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
小米米家智能蒸烤箱 S1 30L 预售:1599 元享蒸烤炸炖四合一

小米米家智能蒸烤箱 S1 30L 预售

11-19 124阅读
一家早期科技基金,今年投了10个亿

一家早期科技基金,今年投了10个亿

周期

11-19 109阅读
炒过Labubu,再也忘不掉日入2万的滋味

炒过Labubu,再也忘不掉日入2万的

“家

11-19 127阅读
咖啡界“老二”闭店上百家,星巴克们开始慌了?

咖啡界“老二”闭店上百家,星巴克

星巴

11-19 110阅读
为什么说MEMS-OXC在智算场景没有未来?

为什么说MEMS-OXC在智算场景没有

智算中心是这一轮科技革命的算力

11-19 109阅读
乔碧萝真实身份曝光, 90后王诗锦接受采访谈事情原委

乔碧萝真实身份曝光, 90后

真人版乔碧萝终于现身,乔碧萝真实

11-19 108阅读
释彦能:银幕硬汉,反派巅峰——正邪交锋,票房破亿传奇!

释彦能:银幕硬汉,反派巅峰—

  在当今动作电影的舞台上,释彦能以

11-19 122阅读
魔兽世界年卡来了 送筋肉鱼人 兔年坐骑,怀旧服幽冥幼龙(魔兽世界年卡来了)

魔兽世界年卡来了 送筋肉

暴雪今天早晨发布了魔兽世界最新的

11-19 99阅读
爱尔兰移民项目身 光环 太多,一份投资,三大收获,四重身份(爱尔兰移民项目身)

爱尔兰移民项目身 光环 太

其实自英国脱欧以来,获得爱尔兰公

11-19 126阅读
微念称与李子柒的案件已完全和解:账号其本人运营 品牌由微念经营

微念称与李子柒的案件已完

11月13日消息,日

11-19 126阅读
重装机兵4失落密码大全_重装机兵4所有失落密码一览

重装机兵4失落密码大全_重

失落密码是《重装机兵4》游戏里面的一

11-19 318阅读
帝国时代3亚洲王朝秘籍_帝国时代3秘籍大全

帝国时代3亚洲王朝秘籍_帝

帝国时代3亚洲王朝(Age of Empires III:

11-19 137阅读
CS1.6怎么加机器人?CS1.6加机器人方法

CS1.6怎么加机器人?CS1.6

《CS1.6》也就是大家都玩过的反恐精英

11-19 192阅读
饥荒通过卡猪人快速回复san值的详细操作方法

饥荒通过卡猪人快速回复sa

饥荒游戏里面玩家经常会面对san值不足

11-19 136阅读
饥荒辣椒酱制作方法及制作材料分享

饥荒辣椒酱制作方法及制作

辣椒酱是饥荒游戏里面的一个特殊食物,不

11-19 139阅读