闭源大模型又行了?Anthropic瞄着DeepSeek打

5个月前 科技 35观看
摘要 Anthropic在今天2025年2月25日,全新发布Claude 3.7 Sonnet与编程助手,也被称为迄今为止最先进的人工智能模型。最大亮点是,Claude 3.7 Sonnet 引入了“思考模式”切换功能,允许用户根据任务复杂

Anthropic在今天2025年2月25日,全新发布Claude 3.7 Sonnet与编程助手,也被称为迄今为止最先进的人工智能模型。42b喜好网-记录每日喜好的科技时尚娱乐生活

最大亮点是,Claude 3.7 Sonnet 引入了“思考模式”切换功能,允许用户根据任务复杂性优化 AI 的响应时间。42b喜好网-记录每日喜好的科技时尚娱乐生活

42b喜好网-记录每日喜好的科技时尚娱乐生活

在扩展思维模式下,Claude 3.7 Sonnet在研究生级推理任务上实现了78.2%的准确率,挑战了 OpenAI的最新模型,并超越了DeepSeek-R1。42b喜好网-记录每日喜好的科技时尚娱乐生活

42b喜好网-记录每日喜好的科技时尚娱乐生活

惊讶的是,即使增加了推理功能,Anthropic依旧保持了之前的定价,即每百万输入tokens3美元,每百万输出tokens15美元。42b喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic对打OpenAI和Deepseek走出新的闭源之路——推理、规划和自我纠正不应该是独立的功能42b喜好网-记录每日喜好的科技时尚娱乐生活

在对Claude 3.7 Sonnet的总结介绍中,Anthropic使用了“将前沿推理变为实用技术”的描述。42b喜好网-记录每日喜好的科技时尚娱乐生活

指出他们开发Claude 3.7 Sonnet的理念与其他推理模型不同。42b喜好网-记录每日喜好的科技时尚娱乐生活

就像人类用一个大脑来处理快速反应和深度思考一样,他们认为推理应该是前沿模型的集成能力,而不是一个完全独立的模型。42b喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic这种统一的方法也将为用户创造更无缝的体验。42b喜好网-记录每日喜好的科技时尚娱乐生活

接受采访时,Anthropic 研究产品管理负责人Dianne Penn也表示:42b喜好网-记录每日喜好的科技时尚娱乐生活

“我们只是认为推理是人工智能的核心部分和核心组件,而不是需要单独付费才能使用的单独功能。就像人类一样,人工智能应该既能快速响应,又能进行复杂思考。42b喜好网-记录每日喜好的科技时尚娱乐生活

对于‘现在几点了?’这样的简单问题,它应该立即回答。42b喜好网-记录每日喜好的科技时尚娱乐生活

但对于复杂的任务——比如计划为期两周的意大利之旅,同时满足无麸质饮食需求——它需要更长的处理时间。”42b喜好网-记录每日喜好的科技时尚娱乐生活

“我们并不认为推理、规划和自我纠正是独立的功能,”42b喜好网-记录每日喜好的科技时尚娱乐生活

“所以这本质上是我们表达这种哲学差异的方式……理想情况下,模型本身应该能够识别问题何时需要更深入的思考并进行调整,而不是要求用户明确选择不同的推理模式。”42b喜好网-记录每日喜好的科技时尚娱乐生活

从技术上看,Claude 3.7 Sonnet在以下几个方面体现了这一理念。42b喜好网-记录每日喜好的科技时尚娱乐生活

首先,Claude 3.7 Sonnet 既是普通的大型语言模型(LLM),也是一个推理模型:你可以选择让模型正常回答,或者在回答前进行更长时间的思考。42b喜好网-记录每日喜好的科技时尚娱乐生活

在标准模式下,Claude 3.7 Sonnet是Claude 3.5 Sonnet 的升级版本。42b喜好网-记录每日喜好的科技时尚娱乐生活

在扩展思考模式下,它会在回答前进行自我反思,从而提高其在数学、物理、指令遵循、编码和许多其他任务上的表现。42b喜好网-记录每日喜好的科技时尚娱乐生活

在这两种模式下,对模型的提示效果相似。42b喜好网-记录每日喜好的科技时尚娱乐生活

其次,当通过API使用Claude 3.7 Sonnet 时,用户还可以控制思考的预算:你可以告诉Claude思考的时间不超过N个 token,N的值可以达到其128Ktoken 的输出限制。42b喜好网-记录每日喜好的科技时尚娱乐生活

意味着你可以在回答速度(和成本)与回答质量之间进行权衡。42b喜好网-记录每日喜好的科技时尚娱乐生活

这就完全满足了现在很多用户“嫌弃”Chatbot在某些回答太慢的诉求!42b喜好网-记录每日喜好的科技时尚娱乐生活

第三,Anthropic在开发推理模型时,对数学和计算机科学竞赛问题的优化较少,而是将重点转移到更真实世界的任务上,这些任务更好地反映了企业实际使用 LLM 的方式。42b喜好网-记录每日喜好的科技时尚娱乐生活

对于企业端而言,各家公司都在加大投入试图将人工智能融入其运营,而目前都在摸索和试错过程中。42b喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic今天的混合模型提供了一条引人注目的中间路线:能够根据手头的任务微调人工智能的性能,从即时客户服务响应到复杂的分析。42b喜好网-记录每日喜好的科技时尚娱乐生活

说实话,Deepseek的横空出世,不少人呐喊,被影响最大的就是Anthropic,人人都在想,还有什么模式可以支撑他们走闭源……42b喜好网-记录每日喜好的科技时尚娱乐生活

今天…… 就来了……42b喜好网-记录每日喜好的科技时尚娱乐生活

和OpenAI与Deepseek不一样(OpenAI为不同的功能维护单独的模型,DeepSeek 则专注于性价比),Anthropic 追求能够处理常规任务和复杂推理的统一系统,并且强技术能力为这条路推山动土,且价格不涨……42b喜好网-记录每日喜好的科技时尚娱乐生活

AI coding还是Anthropic的天下?42b喜好网-记录每日喜好的科技时尚娱乐生活

自 2024 年6月以来,Sonnet其实一直是全球开发人员的首选模型。42b喜好网-记录每日喜好的科技时尚娱乐生活

前不久OpenAI的o3的发布,在编程领域取得许多突破,让人开始担忧Anthropic的编程地位。42b喜好网-记录每日喜好的科技时尚娱乐生活

今天,Anthropic同时推出了Claude Code,其联合创始人兼首席科学官贾里德·卡普兰 (Jared Kaplan) 也对外表示,新模型“在编码方面更加强大,特别是在接管和执行真正复杂的编码任务方面”,势必要夺回,AI coding的一哥地位啊!42b喜好网-记录每日喜好的科技时尚娱乐生活

42b喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic表示,他们的Claude Codd--也是他们首个代理编码工具——将进一步赋权开发人员,该工具以有限的研究预览版形式推出。42b喜好网-记录每日喜好的科技时尚娱乐生活

Claude Code 将作为一个积极的合作者,搜索和阅读代码、编辑文件、编写和运行测试、将代码提交和推送至 GitHub,并使用命令行工具——在每一步都让程序员保持参与。42b喜好网-记录每日喜好的科技时尚娱乐生活

讲真的,别人都在说,AI coding替代程序员、猛猛裁员、35岁危机,人家说“在每一步都让程序员保持参与,做你最好的助手和伙伴”……42b喜好网-记录每日喜好的科技时尚娱乐生活

你猜猜…………42b喜好网-记录每日喜好的科技时尚娱乐生活

他们到底用谁……42b喜好网-记录每日喜好的科技时尚娱乐生活


42b喜好网-记录每日喜好的科技时尚娱乐生活


42b喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
“抽象”主播为何爆火?

“抽象”主播为何爆火?

前不

11-19 112阅读
摸着Meta过河,百度再战AI眼镜

摸着Meta过河,百度再战AI眼镜

“Goo

11-19 107阅读
一家早期科技基金,今年投了10个亿

一家早期科技基金,今年投了10个亿

周期

11-19 108阅读
咖啡界“老二”闭店上百家,星巴克们开始慌了?

咖啡界“老二”闭店上百家,星巴克

星巴

11-19 110阅读
为什么说MEMS-OXC在智算场景没有未来?

为什么说MEMS-OXC在智算场景没有

智算中心是这一轮科技革命的算力

11-19 108阅读
“资源弃子”杨幂还是被踢出了局,和嘉行解约的背后是被闺蜜插刀

“资源弃子”杨幂还是被踢

11-19 111阅读
人民日报评代拍乱象, 代拍为何惹众怒?

人民日报评代拍乱象, 代拍

近期除了家暴一词被大家热议,代拍

11-19 109阅读
贾乃亮帮清购物车, 网友没胆安利给自家老板!

贾乃亮帮清购物车, 网友没

今天双十二,大家剁手了吗!小编是没

11-19 107阅读
章子怡人称国际章, 被巩俐压了这么多年却被称心机婊!

章子怡人称国际章, 被巩俐

今年国际章章子怡可以说是从一众

11-19 116阅读
《我的主场》“篮”大凌晨五点魔鬼拉练 宏远主场喜提冠军大师课

《我的主场》“篮”大凌晨

  如果用运动定义青春,那么篮球必定

11-19 122阅读
万代魂系高端钢普拉大展 解体匠机第三弹高达Mk-II再参展

万代魂系高端钢普拉大展

万代高端模玩魂系列展会《TAMASHII NA

11-19 123阅读
《星刃》开发商否认《胜利女神》将改编动画的传言

《星刃》开发商否认《胜利

《星刃》对于开发商Shift Up而言是一

11-19 127阅读
烟雨江湖千机遗迹怎么开启?烟雨江湖千机遗迹攻略流程

烟雨江湖千机遗迹怎么开启

《烟雨江湖》是一款开放世界武侠冒险手

11-19 211阅读
原子之心巴浦洛夫综合体区域死者位置分享

原子之心巴浦洛夫综合体区

原子之心游戏中的巴浦洛夫综合体区域里

11-19 110阅读
饥荒san值怎么恢复?饥荒恢复san值的途径一览

饥荒san值怎么恢复?饥荒恢

san值是饥荒游戏里面的一个重要数值,玩

11-19 113阅读