DeepSeek V3“报错家门”:我是ChatGPT

7个月前 科技 44观看
摘要文章来源:量子位图片来源:由无界AI生成要说这两天大模型圈的顶流话题,那绝对是非DeepSeek V3莫属了。不过在网友们纷纷测试之际,有个bug也成了热议的焦点——只是少了一个问号,DeepSeek V3竟然称自己是ChatGPT。甚至让它讲

文章来源:量子位RCy喜好网-记录每日喜好的科技时尚娱乐生活

图片来源:由无界AI生成图片来源:由无界AI生成

要说这两天大模型圈的顶流话题,那绝对是非DeepSeek V3莫属了。RCy喜好网-记录每日喜好的科技时尚娱乐生活

不过在网友们纷纷测试之际,有个bug也成了热议的焦点——RCy喜好网-记录每日喜好的科技时尚娱乐生活

只是少了一个问号,DeepSeek V3竟然称自己是ChatGPT。RCy喜好网-记录每日喜好的科技时尚娱乐生活

甚至让它讲个笑话,生成的结果也是跟ChatGPT一样:RCy喜好网-记录每日喜好的科技时尚娱乐生活

加之DeepSeek V3这次爆火的一个亮点,就是训练只花了557.6万美元的成本。RCy喜好网-记录每日喜好的科技时尚娱乐生活

于是乎,有人就开始怀疑了:它不会是在ChatGPT的输出基础上训练的吧?RCy喜好网-记录每日喜好的科技时尚娱乐生活

好巧不巧,Altman也发了一个状态,似乎在暗讽着什么……RCy喜好网-记录每日喜好的科技时尚娱乐生活

不过DeepSeek V3并非是第一个出现“报错家门”的大模型。RCy喜好网-记录每日喜好的科技时尚娱乐生活

例如Gemini就曾说过自己是百度的文心一言……RCy喜好网-记录每日喜好的科技时尚娱乐生活

那么这到底是怎么一回事?RCy喜好网-记录每日喜好的科技时尚娱乐生活


RCy喜好网-记录每日喜好的科技时尚娱乐生活

为什么DeepSeek V3报错家门?


RCy喜好网-记录每日喜好的科技时尚娱乐生活

首先需要强调的一点是,从目前网友们整体讨论的观点来看,说DeepSeek V3是在ChatGPT输出上训练的可能性不大RCy喜好网-记录每日喜好的科技时尚娱乐生活

之所以这么说,正如网友Riley Goodside所总结的那样——因为ChatGPT的影子无处不在。RCy喜好网-记录每日喜好的科技时尚娱乐生活

即便DeepSeek V3故意用ChatGPT的输出做了训练,但这并不重要。所有在ChatGPT之后出现的大模型,几乎都见过它。
例如ShareGPT,一个并不新鲜的ChatGPT对话数据集,许多人已经尝试在它和其它ChatGPT数据源上进行调整。但即便如此,也没能出现DeepSeek V3级别的大模型。

紧接着,Riley Goodside又拿出了DeepSeek V3报告中的一些证据:RCy喜好网-记录每日喜好的科技时尚娱乐生活

而且要是用了ChatGPT数据的话,有些关于DeepSeek V3质量的问题是解释不通的。
例如Pile测试(基础模型压缩Pile的效果),DeepSeek V3得分几乎与Llama 3.1 405B相当,这跟它接没接触ChatGPT数据无关。
而且报告称95%的GPU-hours用于预训练基础模型,即便是跟ChatGPT数据有关,那这部分也会在post-training阶段发生(后5%)。

而比起用没用ChatGPT数据,或许我们应当更加关注的是为什么大模型会频繁出现“报错家门”的问题。RCy喜好网-记录每日喜好的科技时尚娱乐生活

TechCrunch针对这个问题给出了一句犀利的点评:RCy喜好网-记录每日喜好的科技时尚娱乐生活

因为AI公司们获取数据的地方——网络,正在充斥着AI垃圾。

毕竟欧盟的一份报告曾预测,到2026年,90%的在线内容可能是AI生成的。RCy喜好网-记录每日喜好的科技时尚娱乐生活

这种“AI污染”就会让“训练数据彻底过滤AI的输出”变得困难。RCy喜好网-记录每日喜好的科技时尚娱乐生活

AI Now Institute的首席科学家Heidy Khlaaf则表示:RCy喜好网-记录每日喜好的科技时尚娱乐生活

尽管存在风险,开发者依然被从现有AI模型中“蒸馏”知识所带来的成本节约所吸引。
意外地在ChatGPT或GPT-4输出上进行训练的模型,也不一定会展示出让人想起OpenAI定制消息的输出。

那么现在对于网友们热议的问题,量子位进行了一波实测,DeepSeek V3目前还没有解决这个bug。RCy喜好网-记录每日喜好的科技时尚娱乐生活

依旧是少了个问号,回答结果会不一样:RCy喜好网-记录每日喜好的科技时尚娱乐生活


RCy喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek V3更多玩法


RCy喜好网-记录每日喜好的科技时尚娱乐生活

不过有一说一,绝大部分网友对于DeepSeek V3的能力是给予了大大的肯定。RCy喜好网-记录每日喜好的科技时尚娱乐生活

从各路AI大佬们集体直呼“优雅”中就能印证这一点。RCy喜好网-记录每日喜好的科技时尚娱乐生活

而就在这两天,网友们陆续晒出了更多DeepSeek V3加持的实用玩法RCy喜好网-记录每日喜好的科技时尚娱乐生活

例如有网友拿DeepSeek V3和Claude Sonnet 3.5一决高下,在Scroll Hub中分别用它俩创建网站RCy喜好网-记录每日喜好的科技时尚娱乐生活

嗯,DeepSeek V3是有点好用在身上的。RCy喜好网-记录每日喜好的科技时尚娱乐生活


RCy喜好网-记录每日喜好的科技时尚娱乐生活

One More Thing


RCy喜好网-记录每日喜好的科技时尚娱乐生活

对于此前公布的53页论文,也有网友关注到了一个非技术性的细节——RCy喜好网-记录每日喜好的科技时尚娱乐生活

贡献列表中,不仅展示了技术人员,还有数据注释和商务等工作人员:RCy喜好网-记录每日喜好的科技时尚娱乐生活

网友认为这种做法非常符合DeepSeek的调性:RCy喜好网-记录每日喜好的科技时尚娱乐生活

参考链接:
[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/
[2]https://x.com/victormustar/status/1872647314231398524
[3]https://x.com/breckyunits/status/1872422078592516295
[4]https://x.com/op7418/status/1872689338242482203
[5]https://x.com/goodside/status/1872911457857208596
[6]https://x.com/kevinsxu/status/1873146905846530472
AIGC 大模型
展开全文
猜你感兴趣
比亚迪成全球首家达成第1000万辆新能源汽车下线车企

比亚迪成全球首家达成第1000万辆

11月1

11-19 131阅读
极氪总裁提醒用户警惕杀猪盘:低价买车是诱饵

极氪总裁提醒用户警惕杀猪盘:低价

11月19日

11-19 126阅读
天玑9400性能之神!iQOO Neo10系列前瞻

天玑9400性能之神!iQOO Neo10系列

今天,iQOO

11-19 110阅读
中银300亿母基金加速推进

中银300亿母基金加速推进

银行

11-19 112阅读
新茶饮疯狂“24小时”

新茶饮疯狂“24小时”

零售

11-19 102阅读
“资源弃子”杨幂还是被踢出了局,和嘉行解约的背后是被闺蜜插刀

“资源弃子”杨幂还是被踢

11-19 111阅读
NCT DREAM正辑四辑《DREAMSCAPE》登上韩国国内各大专辑周榜一位

NCT DREAM正辑四辑《DREAM

11月11日发行的NCT DREAM正辑

11-19 112阅读
火热气氛拉满!超级音雄·巨星演唱会-汕头站12/22重磅来袭

火热气氛拉满!超级音雄·巨

  在全国收获无数好评、演出场场爆

11-19 122阅读
李子柒被质疑漆器做假,发出过敏照片力证,全身红肿成“电视机”

李子柒被质疑漆器做假,发出

2024年11月12日停更长达三年的李子柒

11-19 129阅读
肖战演郭靖!新《射雕》能复兴徐克的武侠梦吗 网友:肩负文化出海重任

肖战演郭靖!新《射雕》能复

11月18日消息,由

11-19 105阅读
传索尼正在研究如何在PS5主机上原生运行PS3游戏

传索尼正在研究如何在PS5

据最新传闻,索尼目前正在致力于让PS3游

11-19 129阅读
博德之门3怎么装MOD?手把手教你博德之门3MOD安装方法

博德之门3怎么装MOD?手把

博德之门3怎么装MOD?博德之门3游戏是支

11-19 144阅读
碧蓝航线ios反和谐教程_碧蓝航线ios反和谐2024

碧蓝航线ios反和谐教程_碧

碧蓝航线ios反和谐怎么弄?相信很多苹果

11-19 151阅读
僵尸生活2逃离僵尸岛全流程全角色超详细攻略分享(1.62版)

僵尸生活2逃离僵尸岛全流

僵尸生活2逃离僵尸岛是《僵尸生活》游

11-19 112阅读
ePSXe模拟器安卓版怎么导入游戏?ePSXe模拟器安卓版导入游戏教程

ePSXe模拟器安卓版怎么导

ePSXe模拟器安卓版是一款非常棒的可以

11-19 175阅读