免费用!智谱发布Agent产品「AutoGLM沉思」,背后模型比肩DeepSeek-R1

4个月前 科技 29观看
摘要 3月31日消息,智谱在 2025 中关村论坛上发布集深度研究和操作执行于一体的最新 Agent 产品 「AutoGLM沉思」,并发布其背后的GLM-4-Air-0414、深度思考模型 GLM-Z1-Air、沉思模型GLM-Z1-Rumination系列大模型

3月31日消息,智谱在 2025 中关村论坛上发布集深度研究和操作执行于一体的最新 Agent 产品 「AutoGLM沉思」,并发布其背后的GLM-4-Air-0414、深度思考模型 GLM-Z1-Air、沉思模型GLM-Z1-Rumination系列大模型。5gx喜好网-记录每日喜好的科技时尚娱乐生活

同时,由智谱主导,来自东盟十国及“一带一路”沿线的10个国家共同发起了“自主大模型国际共建联盟”正式成立,帮助“一带一路”国家建立自主AI,构建可控的国家级AI基础设施。5gx喜好网-记录每日喜好的科技时尚娱乐生活

AutoGLM 沉思5gx喜好网-记录每日喜好的科技时尚娱乐生活

在AI Agent的发展过程中,智谱始终在不断探索和创新。从最早推出具备Function Call能力的智谱清言(2023.10),到率先上线支持智能体编排的GLMs(2024.1),再到推出全球首个设备操控智能体AutoGLM(2024.10),再到此次的集深度研究和操作执行于一体的AutoGLM沉思。智谱一直引领AI Agent 上界的探索。5gx喜好网-记录每日喜好的科技时尚娱乐生活

作为首个集深度研究能力和操作能力于一体的 Agent,AutoGLM 沉思能一边进行复杂思考,一边执行操作。像人类一样打开并浏览网页,完成从数据检索、分析到生成报告。5gx喜好网-记录每日喜好的科技时尚娱乐生活

与OpenAI 的 Deep Research不同,AutoGLM沉思不仅能深入研究,还能真正执行任务,推动AI Agent从单纯的思考者,进化为能交付结果的智能执行者。5gx喜好网-记录每日喜好的科技时尚娱乐生活

AutoGLM沉思融合了三大能力,即深度思考:能够模拟人类在面对复杂问题时的推理与决策过程;感知世界:能够像人一样获取并理解环境信息;工具使用:能够像人一样调用和操作工具,完成复杂任务。5gx喜好网-记录每日喜好的科技时尚娱乐生活

目前,AutoGLM沉思在智谱清言PC客户端上线,用户可免费体验其研究能力和操作能力。此次发布的为preview版本,核心支持 research 场景;在未来两周,还将进一步扩展更多智能体执行能力,包括推出“虚拟机”版本,进一步增强AI Agent的实际落地能力。5gx喜好网-记录每日喜好的科技时尚娱乐生活

沉思功能,目前已经正式上线智谱清言网页端、PC端和手机App,免费、不限量地开放。这也是国内首个正式开放的Deep Research功能。5gx喜好网-记录每日喜好的科技时尚娱乐生活

AutoGLM沉思背后系列模型4月14日开源5gx喜好网-记录每日喜好的科技时尚娱乐生活

AutoGLM沉思背后,是智谱自主研发的全栈大模型技术。5gx喜好网-记录每日喜好的科技时尚娱乐生活

其技术演进路径包括:GLM-4基座模型 → GLM-Z1推理模型 → GLM-Z1-Rumination沉思模型 → AutoGLM模型。AutoGLM沉思融合了GLM-4的通用能力、GLM-Z1的反思能力、GLM-Z1-Rumination的沉思能力,以及AutoGLM的自动执行能力。5gx喜好网-记录每日喜好的科技时尚娱乐生活

1、基于最新的技术积累,智谱重新训练了一个320亿参数的基座模型 GLM-4-Air-0414,在预训练阶段加入了更多的代码类、推理类数据,并在对齐阶段针对智能体能力进行了优化,模型在工具调用、联网搜索、代码等智能体任务上的能力得到大大加强。GLM-4-Air-0414 以 32B 参数量比肩更大参数量的国内外主流模型,这使得模型在适配智能体任务方面特别有效。5gx喜好网-记录每日喜好的科技时尚娱乐生活

2、基于 GLM-4-Air-0414,智谱引入了更多推理类数据,并在对齐阶段深度优化了通用能力,推出了全新的深度思考模型 GLM-Z1-Air。5gx喜好网-记录每日喜好的科技时尚娱乐生活

在性能表现上,可以与DeepSeek-R1(671B,激活37B)媲美。在 AIME 24/25、LiveCodeBench、GPQA 等基准测试中对 GLM-Z1-Air 进行评估,评估结果显示 GLM-Z1-Air 展现了较为强大的数理推理能力,为更多复杂任务的解决提供了支持。5gx喜好网-记录每日喜好的科技时尚娱乐生活

在推理速度上,GLM-Z1-Air相比 R1 提升了8倍,成本可以降低至1/30,实现高性能与高性价比的双重突破。5gx喜好网-记录每日喜好的科技时尚娱乐生活

GLM-Z1-Air可在消费级显卡上运行。5gx喜好网-记录每日喜好的科技时尚娱乐生活

3、基于GLM-Z1,智谱通过扩展强化学习训练,提升了模型结合工具使用完成长程推理能力,训练出沉思模型GLM-Z1-Rumination。5gx喜好网-记录每日喜好的科技时尚娱乐生活

该模型突破了传统AI单纯依赖内部知识推理的局限,创新性地结合实时联网搜索、动态工具调用、深度分析和自我验证,形成完整的自主研究流程:5gx喜好网-记录每日喜好的科技时尚娱乐生活

- 实时搜索:主动获取最新信息,突破信息孤岛。5gx喜好网-记录每日喜好的科技时尚娱乐生活

- 深度分析:进行多角度逻辑推理,避免单一思维路径。5gx喜好网-记录每日喜好的科技时尚娱乐生活

- 动态验证:不断修正假设,提高研究的准确性与逻辑性。5gx喜好网-记录每日喜好的科技时尚娱乐生活

GLM-Z1-Rumination 能够主动理解用户需求,在复杂任务中不断优化推理、反复验证与修正假设,使研究成果更具可靠性与实用性。相比于传统的推理模型,我们期待沉思模型引领AI助手进入一个“高智商”到“高智商+高自主”的阶段,能够自主完成更复杂、更深入的研究任务。5gx喜好网-记录每日喜好的科技时尚娱乐生活

据介绍,上述模型都将于4月14日开源,并将在未来两周内陆续上线MaaS平台(bigmodel.cn)。5gx喜好网-记录每日喜好的科技时尚娱乐生活

5gx喜好网-记录每日喜好的科技时尚娱乐生活

5gx喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
明星为何争做探店顶流?

明星为何争做探店顶流?

采写/陈纪英编辑/万天南明星的尽头

11-19 138阅读
宝马全新纯电动BMW i4上市,eDrive40售46.99万

宝马全新纯电动BMW i4上市,eDrive

11-19 123阅读
慢热的腾讯,上火的AI搜索

慢热的腾讯,上火的AI搜索

11月1

11-19 118阅读
摸着Meta过河,百度再战AI眼镜

摸着Meta过河,百度再战AI眼镜

“Goo

11-19 104阅读
长沙缓过来了

长沙缓过来了

2024

11-19 101阅读
被审判的麦琳和妖魔化的小红书

被审判的麦琳和妖魔化的小

作者 / 张   特编辑 / 朱   婷运

11-19 107阅读
陶喆深夜送美女回家, 疑似再次出轨遭经纪人否认!

陶喆深夜送美女回家, 疑似

陶喆也算是家喻户晓的歌星了,曾经

11-19 121阅读
中国电影海外推广研讨会在豆园(Doc.Park)举行

中国电影海外推广研讨会在

  近日,原国家广电总局电影局原巡

11-19 106阅读
《令人心动的offer6》:职综天花板如何让英雄主义落地现实

《令人心动的offer6》:职综

  《令人心动的offer》第六季以豆瓣

11-19 104阅读
迪士尼儿童动画或因LGBT话题停播一集:变性少年参加女子排球赛

迪士尼儿童动画或因LGBT话

据多位参与制作

11-19 108阅读
碧蓝航线ios反和谐教程_碧蓝航线ios反和谐2024

碧蓝航线ios反和谐教程_碧

碧蓝航线ios反和谐怎么弄?相信很多苹果

11-19 146阅读
CE修改器怎么用?使用CE修改器进行游戏修改的详细操作方法分享

CE修改器怎么用?使用CE修

CE修改器怎么用?对于很多游戏玩家来说CE

11-19 127阅读
卧龙苍天陨落怎么提升武将好感度?提升武将好感度的方法分享

卧龙苍天陨落怎么提升武将

卧龙苍天陨落怎么提升武将好感度?在卧龙

11-19 107阅读
原子之心电脉冲枪在哪?电脉冲枪获取方法分享

原子之心电脉冲枪在哪?电

原子之心电脉冲枪在哪?电脉冲枪是原子之

11-19 128阅读
原神失物匿于繁华任务怎么做|失物匿于繁华任务攻略

原神失物匿于繁华任务怎么

失物匿于繁华是原神须弥地区魔神主线任

11-19 126阅读