混合推理+最强编码能力大模型Claude Sonnet 3.7上线Amazon Bedrock

2个月前 科技 14观看
摘要 2月26日消息,Anthropic首款混合推理模型Claude Sonnet 3.7近日发布,并第一时间上架亚马逊云科技,用户通过Amazon Bedrock等即可丝滑使用。作为Anthropic迄今为止最智能的模型,Claude 3.7 Sonnet在编码和前端W

2月26日消息,Anthropic首款混合推理模型Claude Sonnet 3.7近日发布,并第一时间上架亚马逊云科技,用户通过Amazon Bedrock等即可丝滑使用。JFC喜好网-记录每日喜好的科技时尚娱乐生活

作为Anthropic迄今为止最智能的模型,Claude 3.7 Sonnet在编码和前端Web开发方面显著提升,实现了全面领先。JFC喜好网-记录每日喜好的科技时尚娱乐生活

此外,Claude 3.7 Sonnet的突出优势是:其是首个混合推理模型,既能快速响应也能进行深度思维,能通过细致、逐步的推理解决复杂问题。通过API调用时,用户可精准控制大模型思考时间,进而准确控制推理成本。一经上线,吸引业内广泛关注。JFC喜好网-记录每日喜好的科技时尚娱乐生活

亚马逊云科技CEO Matt Garman在LinkedIn上发文表示:“Claude 3.7 Sonnet现已在Amazon Bedrock上线,它代表了人工智能推理技术的一项进步。作为Anthropic目前最智能的模型,3.7 Sonnet引入了混合推理功能,既能快速响应,又能进行深入分析,并且可以在这两种模式之间切换。这意味着它具备非凡的灵活性,无论是驱动面向客户的人工智能智能体,还是处理复杂的工作流程,都能对速度、性能和成本进行控制。”JFC喜好网-记录每日喜好的科技时尚娱乐生活

首个混合推理模型Claude Sonnet 3.7,推理成本优化能手JFC喜好网-记录每日喜好的科技时尚娱乐生活

如Anthropic强调,Claude 3.7 Sonnet与市面上的其他推理模型不同,它是一款混合推理模型。JFC喜好网-记录每日喜好的科技时尚娱乐生活

“正如人类使用同一个大脑进行快速反应和深度思考一样,我们认为推理应该是前沿模型的综合能力,而不是完全独立的模型。这种统一的方法也为用户创造了更无缝的体验。”JFC喜好网-记录每日喜好的科技时尚娱乐生活

因此,Claude 3.7 Sonnet同时具备深度推理(深度思维模式,一步一步思考复杂答案)与快速回复(标准模式,实时生成答案)的能力。API用户可以对模型的思考时间进行细粒度控制。JFC喜好网-记录每日喜好的科技时尚娱乐生活

具体而言,Claude 3.7 Sonnet Claude 3.7 Sonnet既可以当作大语言模型使用,也可以当作深度推理模型使用:用户可以选择什么时候让模型快速回答,什么时候让它在回答之前思考更长时间。JFC喜好网-记录每日喜好的科技时尚娱乐生活

在标准模式下,Claude 3.7Sonnet代表了Claude 3.5 Sonnet的升级版。在深度思维模式下,它在回答之前进行深度思考,这提高了Claude 3.7Sonnet在数学、物理、指令遵循、编码和许多其他任务上的表现。JFC喜好网-记录每日喜好的科技时尚娱乐生活

与Claude 3.5 Sonnet相比,Claude 3.7Sonnet模型的输出长度提升15倍以上。Claude 3.7 Sonnet支持最长128K token的输出(64K为普遍可用版本,128K为测试版)。这一增强能力在需要详细内容、多个示例或额外上下文及背景信息时尤为实用。若要生成长输出,可尝试要求模型提供详细大纲(针对写作场景,可指定段落级大纲细节并包含目标字数),然后要求响应按大纲索引段落并重申字数。JFC喜好网-记录每日喜好的科技时尚娱乐生活

当通过API使用Claude 3.7 Sonnet时,用户可以精准控制模型的思考时间,开发者可以通过精准控制模型在处理查询时使用的计算资源量,API用户可以告诉Claude思考的数量不超过 N 个token,N 的值可以是任何值,但输出上限不能超过 128K个token。而模型能力的表现,取决于允许思考的token数量,Claude 3.7 Sonnet让开发者在速度(和成本)与答案质量之间进行权衡。JFC喜好网-记录每日喜好的科技时尚娱乐生活

另外值得一提的是,Claude 3.7 Sonnet也是Anthropic最强大的编码模型,在编码和前端Web开发方面显著提升,实现了全面领先。JFC喜好网-记录每日喜好的科技时尚娱乐生活

根据Anthropic的数据,其标准模式在SWE-bench Verified上的成绩为70.3%,达到行业领先水平。Claude 3.7 Sonnet在多数基准测试中的表现也优于Claude 3.5 Sonnet。这些增强能力使其成为驱动AI智能体和复杂工作流的理想选择。JFC喜好网-记录每日喜好的科技时尚娱乐生活

Claude 3.7 Sonnet的增强能力可惠及多个行业场景。企业可创建直接与客户交互的先进AI助手与智能体;在医疗领域,它能辅助医学影像分析与研究摘要;在金融服务领域,它解决复杂金融建模问题的能力能带来诸多益处。对于开发者而言,它可作为编码助手,审查代码、解释技术概念,并针对不同语言提出改进建议。JFC喜好网-记录每日喜好的科技时尚娱乐生活

上线Amazon Bedrock,助力构建更强大的生成式AI应用JFC喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic的Claude 3.7 Sonnet基础模型在发布的第一时间就已上线Amazon Bedrock。JFC喜好网-记录每日喜好的科技时尚娱乐生活

Claude 3.7 Sonnet提供两种模式——标准模式和深度思维模式,可在Amazon Bedrock中切换,用户可控制思考预算,帮助用户在速度、成本和性能之间找到最优解。JFC喜好网-记录每日喜好的科技时尚娱乐生活

此外,Claude 3.7 Sonnet也被加入Amazon Q Developer的模型列表中。Amazon Q基于Amazon Bedrock构建,开发者可通过Amazon Q为特定任务选择最合适的模型(例如Claude 3.7 Sonnet),以支持更高级的编码工作流,从而加速整个软件开发生命周期的构建。JFC喜好网-记录每日喜好的科技时尚娱乐生活

据亚马逊云科技生成式AI副总裁Vasi Philomin介绍:"使用 Claude 3.7 Sonnet 的早期用户反馈,在使用深度思维模式时,该模型在数学、物理、竞赛编程和深入分析方面表现最为出色。再结合Amazon Bedrock的丰富功能,Claude 3.7 Sonnet将帮助客户构建更强大的生成式AI应用。"JFC喜好网-记录每日喜好的科技时尚娱乐生活

下面,附上Amazon Bedrock上使用Claude 3.7 Sonnet的方法:JFC喜好网-记录每日喜好的科技时尚娱乐生活

在Amazon Bedrock控制台中请求访问权限。在导航窗格中,选择模型访问。然后,修改模型访问以请求访问Claude 3.7 Sonnet。JFC喜好网-记录每日喜好的科技时尚娱乐生活

尝试Claude 3.7 Sonnet,选择导航窗格中Playgrounds下的Chat/Text。然后,选择“选择模型”,并在“类别”下选择了“ Anthropic”,在“模型”下选择“Claude 3.7 Sonnet”。为了启用深度思维模式,在“配置”下切换“模型推理”(Model reasoning)。即可在右侧文本框输入需求问题进行体验。JFC喜好网-记录每日喜好的科技时尚娱乐生活

Claude 3.7 Sonnet还有很强的图像到文本的视觉能力,上传了一张使用Amazon Bedrock创建的详细建筑平面图的图像,就可以收到这份网站计划的详细分析和合理见解。JFC喜好网-记录每日喜好的科技时尚娱乐生活

JFC喜好网-记录每日喜好的科技时尚娱乐生活

JFC喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
努比亚 Z70 Ultra 手机更多参数曝光,后置 50Mp 35mm 大底主摄

努比亚 Z70 Ultra 手机更多参数

11 月

11-19 67阅读
土耳其对亚马逊旗下Twitch处以200万里拉罚款,因数据泄露事件

土耳其对亚马逊旗下Twitch处以20

11月1

11-19 68阅读
超204万人预约华为Mate 70:纯血鸿蒙+麒麟芯自研完全体来了

超204万人预约华为Mate 70:纯血鸿

11月19日

11-19 67阅读
2025款宝骏悦也Plus发布:配备灵眸智驾2.0 Max,定价10.38万

2025款宝骏悦也Plus发布:配备灵眸

11-19 64阅读
一单只挣几块钱,年轻人追捧的代炒是门好生意吗?

一单只挣几块钱,年轻人追捧的代炒

杭州

11-19 67阅读
卖熏鸡卖青团,付费才能抢鲜看,芒果TV靠麦琳挣了多少钱?

卖熏鸡卖青团,付费才能抢鲜

11-19 68阅读
张歆艺第一任老公竟不是袁弘,二婚竟能被宠着这样令人羡慕

张歆艺第一任老公竟不是袁

大家都很喜欢袁弘吧?不仅仅是因为

11-19 61阅读
老九门张副官是不是百岁山?饰演张副官的演员是谁?

老九门张副官是不是百岁山

在热门电视剧《老九门》中,张副官

11-19 74阅读
2024花田音乐节燃爆金乡卫城,重磅阵容嗨唱两天狂欢不停

2024花田音乐节燃爆金乡卫

  11月23至24日,金乡卫城·花

11-19 70阅读
20岁大学生开车26天去上学引百万人围观:从中国南京开到英国杜伦

20岁大学生开车26天去上学

“我真的做到了!

11-19 65阅读
2024年真实有效能赚钱的app有哪些?盘点赚钱软件app排行榜前十名!

2024年真实有效能赚钱的ap

随着移动互联网的快速发展,赚钱的方式也

11-19 219阅读
斯宾塞不喜欢操纵性扩展内容:不能把本体砍掉单独卖

斯宾塞不喜欢操纵性扩展内

随着微软大力推动其游戏在首日即登陆G

11-19 67阅读
原子之心前期速刷神经聚合物的方法分享

原子之心前期速刷神经聚合

神经聚合物是原子之心游戏中用来解锁技

11-19 63阅读
原子之心展览园死者位置_展览园全部死者位置一览

原子之心展览园死者位置_

原子之心游戏的展览园区域中一共拥有11

11-19 69阅读
饥荒宠物洞召唤宠物所需物品一览

饥荒宠物洞召唤宠物所需物

宠物洞是饥荒游戏里面的一个特殊场景,在

11-19 68阅读