梁文锋不语,只是一味“小更新”

2周前 科技 6观看
摘要 昨日凌晨,DeepSeek再度有了新动作——DeepSeek-R1-0528模型于Hugging Face平台正式开源。在发布之前几个小时,DeepSeek小助手在官方交流群中发布低调发布了一则通知:DeepSeek R1模型已完成小版

昨日凌晨,DeepSeek再度有了新动作——DeepSeek-R1-0528模型于Hugging Face平台正式开源。e0N喜好网-记录每日喜好的科技时尚娱乐生活

e0N喜好网-记录每日喜好的科技时尚娱乐生活

在发布之前几个小时,DeepSeek小助手在官方交流群中发布低调发布了一则通知:DeepSeek R1模型已完成小版本的试升级,用户可前往官方网页、App以及小程序进行测试体验(开启深度思考功能)。值得一提的是,此次升级后,API接口及使用方式均维持原状,未作改动。e0N喜好网-记录每日喜好的科技时尚娱乐生活

e0N喜好网-记录每日喜好的科技时尚娱乐生活

对的,没看错,官方说的还是“小版本”升级,不是人们期待已久的大版本R2发布。 e0N喜好网-记录每日喜好的科技时尚娱乐生活

相似的情况在今年3月也发生过,DeepSeek对V3模型开展过小版本升级。当时,官方率先在交流群内发布相关消息,而后才公布具体的更新详情。e0N喜好网-记录每日喜好的科技时尚娱乐生活

实际上,关于DeepSeek-R1-0528,DeepSeek官方暂未发布基准测试成绩。不过,大家可别单纯地认为它真如官方所言,只是一次“小”迭代。e0N喜好网-记录每日喜好的科技时尚娱乐生活

在代码测试平台Live CodeBench中,DeepSeek-R1-0528取得了73.1分的成绩,排名第四。其得分接近OpenAI的o3(75.8分)和o4-mini(80.2分),在性能表现上可直接与OpenAI的o3相媲美。社区推测可能是原计划中的R2模型提前以R1升级版形式推出。 e0N喜好网-记录每日喜好的科技时尚娱乐生活

e0N喜好网-记录每日喜好的科技时尚娱乐生活

另外在一些行业人士看来,参数量攀升至685B,上下文达到164K,是大幅增加,“应该是原本的R2,但效果不及内部预期没升级版本号”,AI博主Orange AI称。e0N喜好网-记录每日喜好的科技时尚娱乐生活

而从实际体验效果来看,经过多方用户的反馈,普遍表明DeepSeek - R1 - 0528在编程能力、逻辑推理能力以及交互能力等多个方面都取得了很大的进步。e0N喜好网-记录每日喜好的科技时尚娱乐生活

在X平台上,有网友总结了更新后的几个亮点:e0N喜好网-记录每日喜好的科技时尚娱乐生活

1、可以像谷歌模型一样进行深度推理e0N喜好网-记录每日喜好的科技时尚娱乐生活

2、文本生成优化:更自然,格式更好e0N喜好网-记录每日喜好的科技时尚娱乐生活

3、独特的推理风格:不仅快速,而且更深度e0N喜好网-记录每日喜好的科技时尚娱乐生活

4、长时思考:单任务处理时长可达30-60分钟e0N喜好网-记录每日喜好的科技时尚娱乐生活

e0N喜好网-记录每日喜好的科技时尚娱乐生活

值得一提的是,这可是能是唯一一个目前能正确做对「9.9 - 9.11」谁更大“难题”的模型。 e0N喜好网-记录每日喜好的科技时尚娱乐生活

e0N喜好网-记录每日喜好的科技时尚娱乐生活

凤凰网科技也尝试着让DeepSeek跑了两个程序试试。e0N喜好网-记录每日喜好的科技时尚娱乐生活

第一个prompt:生成一个天气预报卡片,选中单个卡片时有动态效果,如下雨、晴天等等。e0N喜好网-记录每日喜好的科技时尚娱乐生活

e0N喜好网-记录每日喜好的科技时尚娱乐生活

图|来源于凤凰网科技e0N喜好网-记录每日喜好的科技时尚娱乐生活

第二个prompt:设计一个饮食记录卡,记录每天的食品摄入,并标记相应的卡路里,以及建议的运动计划,可以设计一些扁平化的按钮。e0N喜好网-记录每日喜好的科技时尚娱乐生活

e0N喜好网-记录每日喜好的科技时尚娱乐生活

图|来源于凤凰网科技e0N喜好网-记录每日喜好的科技时尚娱乐生活

不过也有行业从业者反馈,由于prompt输入的不同,不同使用者生成的效果差异较大,一些人将其代码能力类比Claude3.7,还有更广泛层面用户反馈称“感觉幻觉率下降了”、“文字水平有一些提升”。e0N喜好网-记录每日喜好的科技时尚娱乐生活

从这次更新来看,DeepSeek还在往越来越好用的路上走,留给其他国产闭源大模型的时间真的不太多了。e0N喜好网-记录每日喜好的科技时尚娱乐生活


e0N喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
回归即顶流,时代变了,李子柒没变

回归即顶流,时代变了,李子柒没变

热搜第一、播放第一、讨论第一,李

11-19 89阅读
模型能力比肩OpenAI-o1 夸克全新“AI搜题”让新题、难题都有解

模型能力比肩OpenAI-o1 夸克全新

【锋巢网】随着AI融入学习场景,诸

11-19 93阅读
大厂离职博主,卷向海外

大厂离职博主,卷向海外

离开

11-19 77阅读
“抽象”主播为何爆火?

“抽象”主播为何爆火?

前不

11-19 85阅读
一个融了16轮的IPO,投资人集体赚钱了

一个融了16轮的IPO,投资人集体赚

近期

11-19 83阅读
为什么说当下是最适合李子柒回归的时候?

为什么说当下是最适合李子

作者 / 向   向运营 / 狮子座携“

11-19 77阅读
刘学义吴谨言新剧《春花厌》官宣,原著小说三观炸裂超虐

刘学义吴谨言新剧《春花厌

此前有消息传小说《春花厌》影视

11-19 82阅读
泰妍将在今天(18日)下午6点发布迷你六辑《Letter To Myself》

泰妍将在今天(18日)下午6

凭借《To. X》创造热潮的少

11-19 79阅读
TXT迷你七辑《The Star Chapter: SANCTUARY》进入专辑主榜"Billboard 200"(11月23日次)第2位

TXT迷你七辑《The Star Ch

17日,据美国Billboard榜单

11-19 81阅读
不愧是中国第一网红!李子柒油管日收入预估超8万:停更期间单月广告分成超78万

不愧是中国第一网红!李子柒

11月14日消息,据

11-19 78阅读
每年冠军纪录,九号品牌见证AG成就电竞传奇

每年冠军纪录,九号品牌见证

11月16日,KPL年度总决赛决赛在万众瞩目

11-19 88阅读
LUIDA’S BAR推出《DQIII》合作菜单

LUIDA’S BAR推出《DQIII

为纪念HD-

11-19 81阅读
《Amerzone:探险家的记忆传承》跳票至明年第二季度

《Amerzone:探险家的记忆传

Microids已将重制版游戏《Amerzone:探

11-19 81阅读
原子之心剧院死者位置_剧院全部死者所在位置分享

原子之心剧院死者位置_剧

原子之心的剧院区域中一共存在7个死者,

11-19 77阅读
原神5个战斗性隐藏成就攻略

原神5个战斗性隐藏成就攻

5个战斗性成就是原神须弥地区的隐藏任

11-19 93阅读