中国AI模型震惊硅谷 DeepSeek为何一夜火出圈?

6个月前 科技 36观看
摘要 1月28日消息,这两天,中国AI公司深度求索(DeepSeek)发布的大模型DeepSeek-R1震动业界,该模型使用更低的成本和更小的算力规模,实现了足以匹敌美国顶尖AI模型的效果。最新消息显示,DeepSeek已经登顶了中国和美国的

1月28日消息,这两天,中国AI公司深度求索(DeepSeek)发布的大模型DeepSeek-R1震动业界,该模型使用更低的成本和更小的算力规模,实现了足以匹敌美国顶尖AI模型的效果。xUn喜好网-记录每日喜好的科技时尚娱乐生活

最新消息显示,DeepSeek已经登顶了中国和美国的苹果App Store应用商店,一举超越ChatGPT。这一现象让西方媒体都忍不住发文感叹“中国AI模型震惊硅谷”。xUn喜好网-记录每日喜好的科技时尚娱乐生活

据报道,高盛发布报告,随着中国AI大模型DeepSeek的强势崛起,对冲基金已开始观望美国本土培育的AI模式热潮是否能持续。报告还指出,对冲基金上周已开始撤离对科技股的押注。xUn喜好网-记录每日喜好的科技时尚娱乐生活

美股市场周一遭遇科技股抛售狂潮,纳指开盘重挫逾3.5%,芯片股集体走低。截至周一收盘,英伟达暴跌16.97%,市值蒸发近5900亿美元,相当于跌去了三个AMD的市值。博通跌17.4%,AMD跌6.37%,阿斯麦跌5.75%,台积电跌13.33%。xUn喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek是什么?xUn喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek成立于2023年7月17日,是一家创新型科技公司,由知名量化资管巨头幻方量化创立,专注于开发先进的大语言模型(LLM)和相关技术。xUn喜好网-记录每日喜好的科技时尚娱乐生活

幻方量化的掌门人梁文锋是DeepSeek的创始人。他出生于广东湛江,浙江大学毕业,拥有信息与电子工程学系本科和硕士学位,2008年起开始带领团队使用机器学习等技术探索全自动量化交易,2015年幻方量化正式成立。xUn喜好网-记录每日喜好的科技时尚娱乐生活

2021年,幻方量化的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。2023年梁文锋宣布正式进军通用人工智能领域,创办DeepSeek,专注于做真正人类级别的人工智能。xUn喜好网-记录每日喜好的科技时尚娱乐生活

2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2。同年12月,DeepSeek-V3问世,这款性能优越且性价比极高的大语言模型,被硅谷同行誉为“来自东方的神秘力量”。xUn喜好网-记录每日喜好的科技时尚娱乐生活

此前,雷军千万年薪挖角的95后AI“天才少女”罗福莉便是DeepSeek-V2的关键开发者之一。xUn喜好网-记录每日喜好的科技时尚娱乐生活

据大象新闻报道,DeepSeek团队不到140人,多来自清华、北大、北航等顶尖高校的应届博士毕业生、在读生以及硕士生。而且,团队没有“海归”,完全本土人才。xUn喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek为何爆火?xUn喜好网-记录每日喜好的科技时尚娱乐生活

这两天DeepSeek成为科技圈的关注焦点,主要原因在于其以极小的成本训练出了可以和OpenAI的ChatGPT一较高下的AI大模型。xUn喜好网-记录每日喜好的科技时尚娱乐生活

今年1月20日,DeepSeek正式发布DeepSeek-R1大模型,并同步开源模型权重。DeepSeek-R1在数学、代码、自然语言推理等任务上的表现与OpenAI的O1模型正式版不相上下,并采用MIT许可协议,支持免费商用、任意修改和衍生开发。xUn喜好网-记录每日喜好的科技时尚娱乐生活

据每日经济新闻报道,DeepSeek-R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一。xUn喜好网-记录每日喜好的科技时尚娱乐生活

业内认为,DeepSeek正打破算力为王的行业规则。此前,OpenAI提出的Scaling Law被全球AI大模型厂商奉为圭臬,即计算规模越大,训练数据量越多,模型越智能。这也促使英伟达等不断研发拥有更强大算力的产品。而DeepSeek让业内看到通过软件架构及算法的革新,可能也是一条通往更高性能AI大模型的思路。xUn喜好网-记录每日喜好的科技时尚娱乐生活

受此消息影响,美股周一纳指开盘重挫逾3.5%,芯片股集体走低。截至周一收盘,英伟达、台积电、博通、AMD、阿斯麦等均出现不同幅度的下跌,其中最受瞩目的是英伟达暴跌16.97%,市值蒸发近5900亿美元,相当于跌去了三个AMD的市值。xUn喜好网-记录每日喜好的科技时尚娱乐生活

之后,英伟达发布声明称,“DeepSeek的研究成果展示了如何利用测试时计算扩展技术创建新模型,充分利用广泛可用的模型和完全符合出口管制规定的算力。”言外之意,DeepSeek并未违反美国对于英伟达芯片的出口管制规定。xUn喜好网-记录每日喜好的科技时尚娱乐生活

同时,英伟达还在声明中表示,DeepSeek等AI公司的推理需要大量英伟达GPU(图形处理器)和高性能网络,DeepSeek的爆火表明市场对其芯片仍有需求。xUn喜好网-记录每日喜好的科技时尚娱乐生活

据外媒报道,Meta成立了四个专门研究小组来研究国产大模型DeepSeek的工作原理,并基于此来改进旗下大模型Llama。其中两个小组正在试图了解幻方量化如何降低训练和运行DeepSeek的成本。xUn喜好网-记录每日喜好的科技时尚娱乐生活

需求爆火,DeepSeek被挤到宕机,创始人回应xUn喜好网-记录每日喜好的科技时尚娱乐生活

随着DeepSeek的火爆出圈,1月26日,该应用曾出现短时闪崩现象。xUn喜好网-记录每日喜好的科技时尚娱乐生活

对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。xUn喜好网-记录每日喜好的科技时尚娱乐生活

1月27日晚,DeepSeek服务状态页面显示,DeepSeek网页不可用,公司正在调查这一问题。多位网友表示,DeepSeek无法回答对话问题。xUn喜好网-记录每日喜好的科技时尚娱乐生活

1月28日凌晨,DeepSeek于服务状态页面公告称,近期DeepSeek线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。xUn喜好网-记录每日喜好的科技时尚娱乐生活

日前,梁文锋曾在接受媒体采访时表示,中国AI不可能永远处在跟随的位置。“我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”xUn喜好网-记录每日喜好的科技时尚娱乐生活

他认为,英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。xUn喜好网-记录每日喜好的科技时尚娱乐生活

xUn喜好网-记录每日喜好的科技时尚娱乐生活

xUn喜好网-记录每日喜好的科技时尚娱乐生活

xUn喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
超204万人预约华为Mate 70:纯血鸿蒙+麒麟芯自研完全体来了

超204万人预约华为Mate 70:纯血鸿

11月19日

11-19 136阅读
2025款宝骏悦也Plus发布:配备灵眸智驾2.0 Max,定价10.38万

2025款宝骏悦也Plus发布:配备灵眸

11-19 119阅读
可栗口语完成数百万元天使轮融资

可栗口语完成数百万元天使轮融资

近日,A

11-19 107阅读
并购重组大潮AB面:有的“做大做强”有的“拉高出货”

并购重组大潮AB面:有的“做大做强

自证

11-19 111阅读
炒过Labubu,再也忘不掉日入2万的滋味

炒过Labubu,再也忘不掉日入2万的

“家

11-19 127阅读
太太太灵了吧,这是什么「好东西」

太太太灵了吧,这是什么「好

作者 / 西贝偏北运营 / 狮子座还记得

11-19 104阅读
“嫖娼门”王全安:前任个个赛西施,花800元睡站台女,终遭报应

“嫖娼门”王全安:前任个个

11-19 108阅读
陶喆深夜送美女回家, 疑似再次出轨遭经纪人否认!

陶喆深夜送美女回家, 疑似

陶喆也算是家喻户晓的歌星了,曾经

11-19 122阅读
电影《朝花夕拾》将映   张珊萌担任制片人及主演

电影《朝花夕拾》将映

  “积谷防饥,养儿防老”,关注乡村“

11-19 109阅读
火热气氛拉满!超级音雄·巨星演唱会-汕头站12/22重磅来袭

火热气氛拉满!超级音雄·巨

  在全国收获无数好评、演出场场爆

11-19 121阅读
《维纳斯璀璨假期 死或生XTREME》公开实机游玩

《维纳斯璀璨假期 死或生X

台湾光荣特库摩宣布,家机新作沉浸式恋爱

11-19 134阅读
LUIDA’S BAR推出《DQIII》合作菜单

LUIDA’S BAR推出《DQIII

为纪念HD-

11-19 123阅读
杀手6第一章变色龙挑战攻略巴黎挑战变色龙教程

杀手6第一章变色龙挑战攻

杀手6是Hitman系列的最新作,这是一款优

11-19 102阅读
饥荒蜘蛛网超详细获取方法分享

饥荒蜘蛛网超详细获取方法

蜘蛛网是饥荒游戏里面的一个常用材料,有

11-19 133阅读
原神赤王时代的沙漠与大赤沙海任务全流程攻略

原神赤王时代的沙漠与大赤

赤王时代的沙漠与大赤沙海是原神须弥地

11-19 130阅读