Anthropic 的 Claude 3.7 Sonnet 瞄准 OpenAI 和 DeepSeek,开启 AI 新一轮较量

5个月前 科技 25观看
摘要 Anthropic 发布 Claude 3.7 Sonnet 模型,向 OpenAI、DeepSeek 及整个 AI 行业发出警示。这个新模型让用户能够前所未有地控制 AI 在生成响应前的"思考"时间。此次发布同时伴随着命令行 AI 编

Anthropic 发布 Claude 3.7 Sonnet 模型,向 OpenAI、DeepSeek 及整个 AI 行业发出警示。这个新模型让用户能够前所未有地控制 AI 在生成响应前的"思考"时间。此次发布同时伴随着命令行 AI 编程助手 Claude Code 的推出,标志着 Anthropic 正积极进军企业级 AI 市场,这可能会重塑企业软件开发和工作自动化的方式。ywq喜好网-记录每日喜好的科技时尚娱乐生活

当前形势紧迫。上个月,DeepSeek 推出的 AI 模型以远低于美国系统的成本实现了相当的性能,这一消息震惊科技界,导致英伟达股价下跌 17%,引发了对美国 AI 领导地位的担忧。如今,Anthropic 押注于对 AI 推理的精确控制,而不仅仅是原始速度或成本节约,以此获得竞争优势。ywq喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic 的研究产品管理负责人 Dianne Penn 在接受 VentureBeat 采访时表示:"我们认为推理是 AI 的核心组成部分,而不是需要额外付费才能使用的独立功能。就像人类一样,AI 应该能够同时处理快速响应和复杂思考。对于'现在几点了?'这样的简单问题,它应该立即回答。但对于复杂任务,比如规划一个为期两周的意大利旅行并考虑无麸质饮食需求,它需要更多的处理时间。"ywq喜好网-记录每日喜好的科技时尚娱乐生活

基准测试数据支持 Anthropic 的雄心愿景。在扩展思考模式下,Claude 3.7 Sonnet 在研究生级别推理任务中达到 78.2% 的准确率,挑战 OpenAI 的最新模型并超越 DeepSeek-R1。ywq喜好网-记录每日喜好的科技时尚娱乐生活

在实际应用中的指标更具说服力。该模型在零售导向的工具使用方面得分为 81.2%,在指令遵循方面显著提升 (93.2%) —— 这些都是竞争对手要么表现不佳,要么尚未公布结果的领域。ywq喜好网-记录每日喜好的科技时尚娱乐生活

虽然 DeepSeek 和 OpenAI 在传统数学基准测试中领先,但 Claude 3.7 的统一方法证明,单一模型可以有效地在快速响应和深度分析之间切换,这可能让企业不再需要为不同类型的任务维护多个 AI 系统。ywq喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic 同时推出了 Claude Code,这是一个命令行工具,允许开发者将复杂的工程任务直接委托给 AI。该系统在提交代码更改前需要人工批准,体现了业界对负责任 AI 开发的日益关注。ywq喜好网-记录每日喜好的科技时尚娱乐生活

Penn 还用一个意想不到的例子说明了 AI 能力的巨大进步:"我们一直让不同版本的 Claude 玩宝可梦...这个版本已经到达了枯叶市,抓到了多只宝可梦,甚至会刷级升级。它能针对对手选择合适的宝可梦对战。"ywq喜好网-记录每日喜好的科技时尚娱乐生活

对企业客户来说,这可能意味着不必再维护多个用于不同任务的 AI 系统,而是部署一个更强大的统一解决方案。接下来的几个月将揭示 Anthropic 在统一 AI 推理上的押注是否会重塑企业市场,或仅仅成为行业快速发展中的又一次尝试。ywq喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
首发1999元 华硕ROG新款25寸显示器上市:FHD 310Hz屏

首发1999元 华硕ROG新款25寸显示

11月19日

11-19 111阅读
消息称抖音正推进“V”项目,包括直播游戏互动、AI 分身功能等

消息称抖音正推进“V”项目,包括

11 月

11-19 113阅读
土耳其对亚马逊旗下Twitch处以200万里拉罚款,因数据泄露事件

土耳其对亚马逊旗下Twitch处以20

11月1

11-19 107阅读
孙正义黄仁勋互曝往事:差点买下英伟达,错失两千亿美元

孙正义黄仁勋互曝往事:差点买下英

孙正

11-19 110阅读
哪个正常人能拒绝一只毛茸茸的「电子猫咪」?

哪个正常人能拒绝一只毛茸茸的「

猫咪

11-19 129阅读
长安十二时辰龙波是好是坏 龙波扮演者是谁资料作品介绍(长安十二时辰龙波是好是坏)

长安十二时辰龙波是好是坏

《长安十二时辰》这部剧正在热播,在

11-19 101阅读
烈火军校易柏辰演的谁? 经纪人曝假剧本事件始末起底

烈火军校易柏辰演的谁? 经

前段时间,演员易柏辰方发文称曾被

11-19 109阅读
ENHYPEN的第二张正规专辑后续《ROMANCE:UNTOLD-daydream-》刷新了历代K-POP后续专辑中创下了最高初动销量新纪录

ENHYPEN的第二张正规专辑

18日,据Hanteo Chart榜单数

11-19 104阅读
千古玦尘凤染和是凤焰什么关系?白烁是月弥的转世吗?

千古玦尘凤染和是凤焰什么

《千古诀尘》中凤染和是凤焰什么

11-19 112阅读
肖战演郭靖!新《射雕》能复兴徐克的武侠梦吗 网友:肩负文化出海重任

肖战演郭靖!新《射雕》能复

11月18日消息,由

11-19 105阅读
斯宾塞不喜欢操纵性扩展内容:不能把本体砍掉单独卖

斯宾塞不喜欢操纵性扩展内

随着微软大力推动其游戏在首日即登陆G

11-19 129阅读
万代魂系高端钢普拉大展 解体匠机第三弹高达Mk-II再参展

万代魂系高端钢普拉大展

万代高端模玩魂系列展会《TAMASHII NA

11-19 123阅读
杀手6第一章变色龙挑战攻略巴黎挑战变色龙教程

杀手6第一章变色龙挑战攻

杀手6是Hitman系列的最新作,这是一款优

11-19 102阅读
僵尸生活2逃离僵尸岛全流程全角色超详细攻略分享(1.62版)

僵尸生活2逃离僵尸岛全流

僵尸生活2逃离僵尸岛是《僵尸生活》游

11-19 111阅读
饥荒饥饿腰带制作方法及制作材料分享

饥荒饥饿腰带制作方法及制

饥饿腰带是饥荒游戏里面的一件魔法物品

11-19 136阅读