压力给到梁文锋

3个月前 科技 25观看
摘要 这两天,中美大模型公司各有大事发生。4月15日凌晨,OpenAI发布了GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano,它们的核心特征是成本更低,速度更快;同一天,另一家中国明星AI公司,智谱AI

这两天,中美大模型公司各有大事发生。l5j喜好网-记录每日喜好的科技时尚娱乐生活

4月15日凌晨,OpenAI发布了GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano,它们的核心特征是成本更低,速度更快;同一天,另一家中国明星AI公司,智谱AI正式启动上市辅导备案,由中金公司担任辅导机构。备案报告显示,智谱AI将在今年8月至10月完成IPO辅导计划。l5j喜好网-记录每日喜好的科技时尚娱乐生活

此前的3月底,智谱AI CEO张鹏曾告诉《中国企业家》,他判断实现AGI,路程还长,“不管我们融了多少钱,其实都是AGI道路上的盘缠,未来,还需要更多盘缠,我们会持续地做相关的事情”。l5j喜好网-记录每日喜好的科技时尚娱乐生活

如今看来,这个“更多的盘缠”就是指IPO。l5j喜好网-记录每日喜好的科技时尚娱乐生活

2025年开年,DeepSeek“燃爆”AI圈,目前,截至R1模型正式发布已经过去86天。l5j喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek和梁文锋的团队什么时候推出新的大模型产品,尤其是R1的更新版?l5j喜好网-记录每日喜好的科技时尚娱乐生活

《中国企业家》统计了国外Anthropic、Meta等公司更新大模型的周期,如果是模型的重大升级,周期在5至10个月左右;而同一版本的功能升级则在3至4个月之间。l5j喜好网-记录每日喜好的科技时尚娱乐生活

根据DeepSeek官网数据,梁文锋的AI团队更新产品与国外主流公司同频,2024年9月发布V2.5,12月发布V3,2025年3月将V3更新为V3-0324版本,也几乎每隔3个月就会迎来一次升级。l5j喜好网-记录每日喜好的科技时尚娱乐生活

有一些预测认为,DeepSeek下一次更新R1模型可能是在5月初,届时或提前发布,但DeepSeek方面目前还尚未对这种预测进行回应。l5j喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI也在追求更小更快l5j喜好网-记录每日喜好的科技时尚娱乐生活

公开资料显示,GPT-3的参数规模为1750亿,GPT-4的参数规模为1.76万亿,到了GPT-4o参数约2000亿规模,此次OpenAI推出的GPT-4.1 Mini,被称作OpenAI的高效小型模型,在多个基准测试中表现超越GPT-4o,大幅减少延迟并降低83%成本。l5j喜好网-记录每日喜好的科技时尚娱乐生活

GPT-4.1 Nano被称之为首个超小型模型,它能支持100万token的上下文窗口,适用于低延迟任务,如分类和自动补全。l5j喜好网-记录每日喜好的科技时尚娱乐生活

值得注意的是,上述三个模型将上下文窗口处理的规模从GPT-4o的128K直接提升至100万token(1M)。这意味着模型在更长的文本中保持专注和理解的能力得到了强化。l5j喜好网-记录每日喜好的科技时尚娱乐生活

具体到成本、价格方面,GPT‑4.1比GPT‑4o便宜26%,输入、输出分别是每百万token2美元和8美元;GPT‑4.1 Nano输入、输出分别为0.1美元和0.4美元。l5j喜好网-记录每日喜好的科技时尚娱乐生活

对比DeepSeek,标准时间段内,V3模型输入、输出百万token的费用为0.5元、8元,R1推理的费用分别为1元和16元。l5j喜好网-记录每日喜好的科技时尚娱乐生活

可以说,OpenAI也打上了token的价格战,价格直接对标DeepSeek。l5j喜好网-记录每日喜好的科技时尚娱乐生活

与此同时,OpenAI已暂停了其此前2月发布的GPT-4.5,原因在于成本太高,其API定价为输入、输出每百万token75美元、150美元。官方回应说此次调整旨在将更多资源投入未来模型的研发。l5j喜好网-记录每日喜好的科技时尚娱乐生活

关于开源,OpenAI的CEO山姆·阿尔特曼不得不走向与DeepSeek同样的路径,他曾表示,DeepSeek的出现并未影响GPT的增长,OpenAI将推出更好的开源模型。l5j喜好网-记录每日喜好的科技时尚娱乐生活

不过,在DeepSeek冲击之下,阿尔特曼曾经一度非常恼火,甚至恐慌,他曾在社交平台上指责R1模型使用了GPT的数据蒸馏,又写公开信给美国政府,声称限制AI技术流向中国等国家,并禁用DeepSeek。l5j喜好网-记录每日喜好的科技时尚娱乐生活

但这并不影响DeepSeek的影响力。在英伟达的2025GTC开幕主题演讲会上,黄仁勋数次提到R1模型,并用R1模型验证了黄仁勋所谓的“推理越多,所需算力越多”的说法。
l5j喜好网-记录每日喜好的科技时尚娱乐生活

除了OpenAI,谷歌在4月9日也举办了发布会,宣布推出Agent2Agent智能体交互协议,该协议允许生态系统中的AI智能体进行底层技术无关的相互操作。多个智能体的协作将带来更高的自主性,同时成倍提高生产力、降低长期成本。l5j喜好网-记录每日喜好的科技时尚娱乐生活

梁文锋的主场时间又快到了
l5j喜好网-记录每日喜好的科技时尚娱乐生活

在R1模型“爆火”之后,DeepSeek除了模型升级,人事布局上动作颇多,DeepSeek官网在3月份发布了招聘CFO、COO、财务负责人岗位的信息。这也被一些媒体解读为DeepSeek在为融资做准备;模型方面,DeepSeek最大的动作是3月25日发布了V2模型的更新版。l5j喜好网-记录每日喜好的科技时尚娱乐生活

目前,DeepSeek并未发布有关融资方面的信息。4月3日,梁文锋和团队发表了一篇论文,题目是《通用奖励建模的推理时间缩放》,文章论述了如何让注意力机制更高效地处理更长的上下文等。l5j喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek“燃爆”AI圈后,外界对其充满好奇和新的期待。潞晨科技CEO尤洋近期在接受《中国企业家》采访时说,如果有机会跟梁文锋面对面,他最想问梁文锋的是他最终的目标是什么,“梁文锋是想做一个成功的商业化公司,还是想通过一些其他手段做一些非盈利的事情?这两者肯定差距是非常大的,OpenAI可能还是想做一个Google那样的非常高价值的商业化公司。”l5j喜好网-记录每日喜好的科技时尚娱乐生活

记者了解到,目前,无论是杭州本地的大公司,还是深圳的顶级创投,都难见梁文锋一面。l5j喜好网-记录每日喜好的科技时尚娱乐生活

近期英伟达公开表示,美国政府正在限制其H20芯片向中国的出口,并且H20芯片对华出口需要获得许可证,这一要求是“无限期”。l5j喜好网-记录每日喜好的科技时尚娱乐生活

而H20芯片正是梁文锋最在意的“基础设施”,早先,梁文锋在接受媒体采访时说,“我们真正的挑战从来不是资金,而是高端芯片的出口禁令。”l5j喜好网-记录每日喜好的科技时尚娱乐生活

不过,面对禁令,梁文锋也并非坐以待毙,他曾在接受媒体采访时说,“英伟达的GPU没有什么神秘之处,但要赶上他们,就必须重建团队、付出时间和成本,追赶下一代技术——这才是真正的护城河。”l5j喜好网-记录每日喜好的科技时尚娱乐生活


l5j喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
外媒:英伟达新款Blackwell AI芯片面临过热问题,或致数据中心部署延期

外媒:英伟达新款Blackwell AI芯片

11月1

11-19 105阅读
电池容量大了iPhone快一倍 今年国产手机咋突然悟了

电池容量大了iPhone快一倍 今年

不知道为

11-19 111阅读
趁iPhone16的AI还没落地,国产手机卷疯了

趁iPhone16的AI还没落地,国产手机

乔布

11-19 122阅读
撑起“北方第二城”,凭什么是它?

撑起“北方第二城”,凭什么是它?

全国

11-19 113阅读
“至少需要招聘90名投资经理”

“至少需要招聘90名投资经理”

VC/PE

11-19 115阅读
金鸡奖这一夜,人情冷暖、江湖职位,在王骁身上体现得极尽描摹

金鸡奖这一夜,人情冷暖、江

11-19 111阅读
《假日暖洋洋》姚晨与小11岁白宇演 姐弟恋 ,别说,还真甜(假日暖洋洋姚晨与小11岁白宇演)

《假日暖洋洋》姚晨与小11

有生之年,欣喜相逢。 我是温暖,欢迎

11-19 110阅读
于谦因釜山行爆红, 啥梗真没想到讲相声的他竟出演过这么多作品

于谦因釜山行爆红, 啥梗真

于谦明明就是一个讲相声的人,怎么

11-19 116阅读
魔兽世界年卡来了 送筋肉鱼人 兔年坐骑,怀旧服幽冥幼龙(魔兽世界年卡来了)

魔兽世界年卡来了 送筋肉

暴雪今天早晨发布了魔兽世界最新的

11-19 97阅读
童年女神归来!《猫眼三姐妹》动画将迎来重制

童年女神归来!《猫眼三姐妹

根据海外情报师

11-19 119阅读
遥远未来的末世乌托邦,2D动作解谜游戏《默途》移动版即将上线

遥远未来的末世乌托邦,2D动

《默途》是由梦匠工作室开发的一款2D

11-19 123阅读
原子之心电脉冲枪在哪?电脉冲枪获取方法分享

原子之心电脉冲枪在哪?电

原子之心电脉冲枪在哪?电脉冲枪是原子之

11-19 126阅读
饥荒制作刷肉机快速刷肉的详细操作方法

饥荒制作刷肉机快速刷肉的

大肉是饥荒游戏里面的重要食物,主要是猪

11-19 122阅读
原神超越时间的虚影全流程解析|超越时间的虚影隐藏任务攻略

原神超越时间的虚影全流程

超越时间的虚影是原神须弥沙漠地区的隐

11-19 107阅读
原神愚人者人愚之任务攻略|愚人者人愚之隐藏任务详解

原神愚人者人愚之任务攻略

愚人者人愚之是原神须弥地区的隐藏任务

11-19 125阅读