国产开源模型,代码能力比肩 Claude,DeepSeek-V3 正式发布

7个月前 科技 38观看
摘要文章来源:DeepSeek图片来源:由无界AI生成今天,我们全新系列模型 DeepSeek-V3 首个版本上线并同步开源。登录官网 chat.deepseek.com 即可与最新版 V3 模型对话。API 服务已同步更新,接口配置无需改动。当前版本的 DeepSee

文章来源:DeepSeekx5Q喜好网-记录每日喜好的科技时尚娱乐生活

图片来源:由无界AI生成图片来源:由无界AI生成

今天,我们全新系列模型 DeepSeek-V3 首个版本上线并同步开源。x5Q喜好网-记录每日喜好的科技时尚娱乐生活

登录官网 chat.deepseek.com 即可与最新版 V3 模型对话。API 服务已同步更新,接口配置无需改动。当前版本的 DeepSeek-V3 暂不支持多模态输入输出。x5Q喜好网-记录每日喜好的科技时尚娱乐生活


x5Q喜好网-记录每日喜好的科技时尚娱乐生活

性能对齐海外领军闭源模型


x5Q喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练。x5Q喜好网-记录每日喜好的科技时尚娱乐生活

论文链接:x5Q喜好网-记录每日喜好的科技时尚娱乐生活

https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdfx5Q喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。x5Q喜好网-记录每日喜好的科技时尚娱乐生活

  • 百科知识:DeepSeek-V3 在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5 显著提升,接近当前表现最好的模型 Claude-3.5-Sonnet-1022。
  • 长文本:长文本测评方面,在DROP、FRAMES 和 LongBench v2 上,DeepSeek-V3 平均表现超越其他模型。
  • 代码:DeepSeek-V3 在算法类代码场景(Codeforces),远远领先于市面上已有的全部非 o1 类模型,并在工程类代码场景(SWE-Bench Verified)逼近 Claude-3.5-Sonnet-1022。
  • 数学:在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(CNMO 2024)上,DeepSeek-V3 大幅超过了所有开源闭源模型。
  • 中文能力:DeepSeek-V3 与 Qwen2.5-72B 在教育类测评 C-Eval 和代词消歧等评测集上表现相近,但在事实知识 C-SimpleQA 上更为领先。


x5Q喜好网-记录每日喜好的科技时尚娱乐生活

生成速度提升至 3 倍


x5Q喜好网-记录每日喜好的科技时尚娱乐生活

通过算法和工程上的创新,DeepSeek-V3 的生成吐字速度从 20 TPS 大幅提高至 60 TPS,相比 V2.5 模型实现了 3 倍的提升,为用户带来更加迅速流畅的使用体验。x5Q喜好网-记录每日喜好的科技时尚娱乐生活


x5Q喜好网-记录每日喜好的科技时尚娱乐生活

API 服务价格调整


x5Q喜好网-记录每日喜好的科技时尚娱乐生活

随着性能更强、速度更快的 DeepSeek-V3 更新上线,我们的模型 API 服务定价也将调整为每百万输入 tokens 0.5 元(缓存命中)/ 2 元(缓存未命中),每百万输出 tokens 8 ,以期能够持续地为大家提供更好的模型服务。x5Q喜好网-记录每日喜好的科技时尚娱乐生活

与此同时,我们决定为全新模型设置长达 45 的优惠价格体验期:即日起至 2025 2 8 ,DeepSeek-V3 的 API 服务价格仍然会是大家熟悉的每百万输入 tokens 0.1 元(缓存命中)/ 1 元(缓存未命中),每百万输出 tokens 2 ,已经注册的老用户和在此期间内注册的新用户均可享受以上优惠价格。x5Q喜好网-记录每日喜好的科技时尚娱乐生活


x5Q喜好网-记录每日喜好的科技时尚娱乐生活

开源权重和本地部署


x5Q喜好网-记录每日喜好的科技时尚娱乐生活

DeepSeek-V3 采用 FP8 训练,并开源了原生 FP8 权重。x5Q喜好网-记录每日喜好的科技时尚娱乐生活

得益于开源社区的支持,SGLangLMDeploy  第一时间支持了 V3 模型的原生 FP8 推理,同时 TensorRT-LLM MindIE 则实现了 BF16 推理。此外,为方便社区适配和拓展应用场景,我们提供了从 FP8 到 BF16 的转换脚本。x5Q喜好网-记录每日喜好的科技时尚娱乐生活

模型权重下载和更多本地部署信息请参考: x5Q喜好网-记录每日喜好的科技时尚娱乐生活

https://huggingface.co/deepseek-ai/DeepSeek-V3-Basex5Q喜好网-记录每日喜好的科技时尚娱乐生活

“以开源精神和长期主义追求普惠 AGI”是 DeepSeek 一直以来的坚定信念。我们非常兴奋能与社区分享在模型预训练方面的阶段性进展,也十分欣喜地看到开源模型和闭源模型的能力差距正在进一步缩小。x5Q喜好网-记录每日喜好的科技时尚娱乐生活

这是一个全新的开始,未来我们会在 DeepSeek-V3 基座模型上继续打造深度思考、多模态等更加丰富的功能,并将持续与社区分享我们最新的探索成果。x5Q喜好网-记录每日喜好的科技时尚娱乐生活

大模型
展开全文
猜你感兴趣
今年双11大变样,淘宝京东不卷了!

今年双11大变样,淘宝京东不卷了!

在被电商平台造出的第16个年头,双

11-19 114阅读
北上广深一线城市爱买啥车 北京喜欢比亚迪、上海广州更爱特斯拉

北上广深一线城市爱买啥车 北京

11月19日

11-19 110阅读
广汽传祺S7大五座SUV全球首秀,预计明年上半年上市

广汽传祺S7大五座SUV全球首秀,预

11-19 135阅读
一家城配自动驾驶服务商,融了7个亿丨投融周报

一家城配自动驾驶服务商,融了7个

大家

11-19 127阅读
投中的播客栏目,叫“大北窑14F”

投中的播客栏目,叫“大北窑14F”

投中

11-19 126阅读
深入人心的人生句子,精致有个性,总有一句适合你(深入人心的人生句子)

深入人心的人生句子,精致有

一、 人生没有多走的路,脚下的每

11-19 108阅读
NCT成员道英自2021年演出《玛丽・安东妮》之后睽违3年再度登上音乐剧舞台演出《笑面人》

NCT成员道英自2021年演出

NCT成员道英自2021年演出《玛

11-19 109阅读
金角大王与银角大王可动人偶开启预定:超逼真还原童年记忆

金角大王与银角大王可动人

近日haoyutoys官

11-19 111阅读
徐克执导!新《射雕英雄传》官宣定档2025大年初一 肖战饰演郭靖

徐克执导!新《射雕英雄传》

11月15日消息,今

11-19 107阅读
2024年全球票房十强!电影《毒液:最后一舞》中国票房破6亿

2024年全球票房十强!电影《

11月13日消息,根

11-19 107阅读
《彩虹六号:围攻》“COLLISION POINT行动”12月3日推出

《彩虹六号:围攻》“COLLIS

中国,上海– 2024年11月18日 – 今天,

11-19 133阅读
动作射击新作《Kusan: City Of Wolves》公布 2026年发售

动作射击新作《Kusan: Cit

韩国开发商CIRCLEfromDOT与英国发行商

11-19 117阅读
英国独立游戏展会WASD宣布无力维持 将永久停办

英国独立游戏展会WASD宣布

由于举办英国游戏行业展会WASD的公司

11-19 139阅读
帝国时代2高清版秘籍,帝国时代2高清重制版(HD版)秘籍

帝国时代2高清版秘籍,帝国

帝国时代2高清版是最近很多玩家在玩的

11-19 123阅读
卧龙苍天陨落武将韩当解锁方法详细介绍

卧龙苍天陨落武将韩当解锁

韩当是三国历史上孙吴阵营的名将,在卧龙

11-19 118阅读