IBM 发布新的 Granite 3.2 系列模型,实现按需推理能力

5个月前 科技 26观看
摘要 为了在企业人工智能市场中开拓自己的领地,IBM 公司今天推出了新一代 Granite AI 模型系列,包含实验性推理能力、视觉和预测功能。与以往每次发布一样,IBM 以开放源代码 Apache 2.0 许可证发布这

为了在企业人工智能市场中开拓自己的领地,IBM 公司今天推出了新一代 Granite AI 模型系列,包含实验性推理能力、视觉和预测功能。vaO喜好网-记录每日喜好的科技时尚娱乐生活

与以往每次发布一样,IBM 以开放源代码 Apache 2.0 许可证发布这些模型。所有 Granite 模型现已在 Hugging Face 上线,部分模型也可在 IBM watson.ai 及其他平台上使用。vaO喜好网-记录每日喜好的科技时尚娱乐生活

这个新系列包含旗舰级纯文本大语言模型 Granite 3.2 Instruct,有 8B 和 2B 两个版本。它可以执行总结、问题解决和代码生成等任务,并且设计为可以遵循指令。这些类型的模型最适合构建 AI 助手和代理。两个版本都经过训练,可以使用类似于其他行业标准模型的"思维链"推理,但 IBM 工程师特别设计了更小、性能更高的模型。vaO喜好网-记录每日喜好的科技时尚娱乐生活

每个模型的推理能力都可以通过编程方式开启或关闭。这意味着 IBM 不需要发布单独的"推理模型",而是创建了一个可以在对话模式和推理模式之间切换的模型。由于推理在部署时需要大量计算资源,在不需要时关闭这一功能可以节省大量能源。vaO喜好网-记录每日喜好的科技时尚娱乐生活

IBM AI 研究副总裁 Sriram Raghavan 表示:"AI 的下一个时代关注效率、集成和实际影响 - 企业无需过度投入计算资源就能实现强大的成果。"vaO喜好网-记录每日喜好的科技时尚娱乐生活

推理模型通过"逐步"思考问题,业内通常称之为"思维链"。自 DeepSeek 的 R1 发布以来,这类模型越来越受欢迎。大多数推理模型会扫描整个推理空间以发现最佳逻辑"路径",然后生成最终答案。然而,一旦确定某条路径不可行,就没有必要继续探索整个路径。vaO喜好网-记录每日喜好的科技时尚娱乐生活

IBM 工程师开发了一种新颖的推理扩展技术,通过使用第二个过程奖励模型添加奖励系统,降低了推理任务的计算成本。这个奖励模型会监控大语言模型,并在推理过程中将其引导至具有更高置信度结果的逻辑路径。结合可以扫描整个逻辑空间的搜索技术,IBM 研究人员表示,与一体化的 R1 相比,他们能够创建一个更小、更高效的推理模型方案。vaO喜好网-记录每日喜好的科技时尚娱乐生活

SiliconANGLE 姐妹市场研究公司 theCUBE Research 的首席分析师 Dave Vellante 表示:"DeepSeek 的 R1 发布在某种程度上承认了 IBM 更小、高效率的模型策略。IBM 的简报强化了这一观点,指出 DeepSeek 早在 2024 年 12 月就使用了专家混合和其他效率方法,但直到最近 R1 受到关注才引起市场注意。我们认为这呼应了 IBM 在训练效率和专业架构方面的方法。"vaO喜好网-记录每日喜好的科技时尚娱乐生活

IBM 表示,Granite 3.2 8B 经过调优后,在 AIME2024 和 MATH500 等数学推理基准测试中可以与 Claude 3.5 Sonnet 和 OpenAI GPT-4o 等更大的模型相媲美。vaO喜好网-记录每日喜好的科技时尚娱乐生活

新的多模态视觉模型和更小的护栏模型vaO喜好网-记录每日喜好的科技时尚娱乐生活

IBM 还发布了新的多模态 Granite Vision 3.2 2B,具备计算机视觉能力,专门训练用于帮助企业处理视觉文档理解。vaO喜好网-记录每日喜好的科技时尚娱乐生活

Granite Vision 可以处理各种视觉理解任务,但最适合处理文档。虽然大多数视觉语言模型都是为视觉任务设计的,但很少有模型在光学字符或文本识别方面表现出色。IBM 的工程团队花费了大量时间训练 Vision 3.2,使其能够识别布局、字体、图表和信息图表的独特视觉特征。vaO喜好网-记录每日喜好的科技时尚娱乐生活

Granite Guardian 3.2 是 IBM 最新的护栏 AI 模型,旨在检测和突出显示提示和响应中的风险。公司表示,它提供了与 3.1 相当的性能,但速度更快,成本更低。vaO喜好网-记录每日喜好的科技时尚娱乐生活

Guardian 3.2 的一个优点是在监控输入和输出时提供"口头置信度"指示。它不是简单地表示二元的"是"或"否",而是表达"高"或"低"的置信水平。这为开发人员提供了更好的指示,帮助他们判断是否可以信任或拒绝输出,给出了一个可以使用的阈值。vaO喜好网-记录每日喜好的科技时尚娱乐生活

除了更新的 8B 版本外,IBM 还发布了两个新的模型规模。第一个是精简的 50 亿参数版本,保持接近原始版本的性能。第二个是 Granite 3.2 3B-A800M,通过微调专家混合基础模型创建。它通过一次只激活其 30 亿参数中的 8 亿参数来运行,以实现低成本高性能。vaO喜好网-记录每日喜好的科技时尚娱乐生活

IBM Granite 系列的最后一个模型包括紧凑型 Granite Timeseries 模型,也称为 Tiny Time Mixers。最新添加的 Granite-Timeseries-TTM-R2.1 扩展了模型功能,可以进行长达两年的日常和每周预测。时间序列模型适用于预测金融、经济、供应链需求预测和零售季节性库存规划等行业的长期趋势。vaO喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
小米第三季度研发费用60亿 雷军:小米坚持技术为本的铁律

小米第三季度研发费用60亿 雷军:

11月19日

11-19 125阅读
小米手机快速占领高端:4000-6000元份额大涨

小米手机快速占领高端:4000-6000

11月18日

11-19 111阅读
宇瞻发布NOX RGB DDR5电竞内存条,速度高达8000MT/s

宇瞻发布NOX RGB DDR5电竞内存条

11-19 122阅读
睿蓝8七座纯电MPV上市,起售价13.78万元

睿蓝8七座纯电MPV上市,起售价13.7

11-19 108阅读
慢热的腾讯,上火的AI搜索

慢热的腾讯,上火的AI搜索

11月1

11-19 120阅读
毛不易李雪琴:《毛雪汪》录了三年一百期,不白干不白干!|Talk独家探班

毛不易李雪琴:《毛雪汪》录

作者 / 朱   婷运营 / 狮子座“今

11-19 122阅读
让赵露思摇来肖战鹿晗打call的《珠帘玉幕》,好看不?|Talk剧评

让赵露思摇来肖战鹿晗打ca

作者 / 张   特编辑 / 阿   笔运

11-19 128阅读
Netflix,振奋时刻下的暗潮

Netflix,振奋时刻下的暗潮

作者 / 向   向运营 / 狮子座和202

11-19 108阅读
人民日报评代拍乱象, 代拍为何惹众怒?

人民日报评代拍乱象, 代拍

近期除了家暴一词被大家热议,代拍

11-19 109阅读
《扫黑风暴》郑毅红结局是什么?她最后有没有落网?

《扫黑风暴》郑毅红结局是

电视剧《扫黑风暴》郑毅红结局是

11-19 112阅读
每年冠军纪录,九号品牌见证AG成就电竞传奇

每年冠军纪录,九号品牌见证

11月16日,KPL年度总决赛决赛在万众瞩目

11-19 115阅读
《星刃》开发商否认《胜利女神》将改编动画的传言

《星刃》开发商否认《胜利

《星刃》对于开发商Shift Up而言是一

11-19 127阅读
动作射击新作《Kusan: City Of Wolves》公布 2026年发售

动作射击新作《Kusan: Cit

韩国开发商CIRCLEfromDOT与英国发行商

11-19 116阅读
界面设计全面升级 NVIDIA app实际体验:五大靓点堪称N卡必备搭档

界面设计全面升级 NVIDIA

11-19 119阅读
饥荒金色腰带有什么用?饥荒金色腰带用途详细介绍

饥荒金色腰带有什么用?饥

饥荒金色腰带有什么用?金色腰带是饥荒游

11-19 131阅读