微软的“1-bit” AI模型仅用CPU运行,性能媲美更大系统

3个月前 科技 15观看
摘要 在存储驱动大语言模型底层神经网络的数值权重时,大多数现代AI模型依赖于16位或32位浮点数的精度。但这种精度往往会导致巨大的内存占用(最大模型可能需要数百GB内存)以及在响应提示时所需处理复

在存储驱动大语言模型底层神经网络的数值权重时,大多数现代AI模型依赖于16位或32位浮点数的精度。但这种精度往往会导致巨大的内存占用(最大模型可能需要数百GB内存)以及在响应提示时所需处理复杂矩阵乘法所消耗的大量运算资源。0JY喜好网-记录每日喜好的科技时尚娱乐生活

现今,Microsoft 的 General Artificial Intelligence 团队的研究人员发布了一种全新的神经网络模型,该模型只使用三个不同的权值:-1、0 或 1。在此前 Microsoft Research 于2023年发表的工作基础上,新模型的“ternary”架构降低了整体复杂性,并带来了显著的计算效率优势,使其能够在简单的桌面CPU上高效运行。尽管权重精度大幅降低,研究人员仍宣称该模型“能够在广泛任务中实现与同等规模先进开放权重、全精度模型相媲美的性能”。0JY喜好网-记录每日喜好的科技时尚娱乐生活

关注你的权重0JY喜好网-记录每日喜好的科技时尚娱乐生活

简化模型权重的概念在AI研究中并非全新。多年来,研究人员一直在尝试利用量化技术将神经网络权重压缩至更小的内存空间。近年来,最极端的量化尝试集中于所谓的 “BitNets”,这种方法将每个权重表示为一个Bit ( 表示 +1 或 -1 )。0JY喜好网-记录每日喜好的科技时尚娱乐生活

新的 BitNet b1.58b 模型没有达到那种极端——这种三元系统被称为 “1.58-bit”,因为这是表示三个数值所需的平均位数 ( log(3)/log(2) )。但它通过成为“首个以原生方式、在大规模训练下实现1-bit大语言模型的开源模型”而与以往的研究区别开来,研究人员写道,该模型基于包含4万亿 tokens 的训练数据集构建了一个拥有20亿 tokens 的模型。0JY喜好网-记录每日喜好的科技时尚娱乐生活

这里的“原生”至关重要,因为许多以往的量化尝试只是对使用全精度大浮点数预先训练好的模型进行事后尺寸缩减。研究人员写道,这种训练后量化可能会导致与原始模型相比出现“显著的性能下降”。与此同时,其他原生训练的 BitNet 模型规模较小,“可能尚未达到大型全精度模型的能力”。0JY喜好网-记录每日喜好的科技时尚娱乐生活

规模是否重要?0JY喜好网-记录每日喜好的科技时尚娱乐生活

减少模型内部权重复杂度最明显的优势是降低内存需求。与同等参数规模的其他开放权重模型需要大约2到5GB内存不同,BitNet b1.58 模型仅需0.4GB内存即可运行。0JY喜好网-记录每日喜好的科技时尚娱乐生活

但这种简化的权重系统也使得模型在推理时运行更为高效,其内部操作更多地依赖简单的加法指令,而较少使用计算成本高昂的乘法指令。研究人员估计,这些效率提升使得 BitNet b1.58 模型相比类似的全精度模型,能耗下降了85%到96%。0JY喜好网-记录每日喜好的科技时尚娱乐生活

通过使用专为 BitNet 架构设计的高度优化内核,BitNet b1.58 模型的运行速度也比标准全精度 Transformer 上运行的相似模型快了数倍。研究人员写道,该系统足够高效,单个CPU即可达到“媲美人类阅读速度(每秒5至7个Token)”的速度(你可以在多款ARM和x86 CPU上下载并运行这些优化内核,或通过该网络演示进行体验)。0JY喜好网-记录每日喜好的科技时尚娱乐生活

关键的是,研究人员表示这些改进并未以牺牲在各种测试推理、数学及“知识”能力的基准测试中的性能为代价(尽管这一说法尚未被独立验证)。在多个常见基准测试上的平均结果表明,BitNet“在能力上几乎与同类领先模型持平,同时提供了显著提高的效率”。0JY喜好网-记录每日喜好的科技时尚娱乐生活

尽管内存占用更小,BitNet 在许多基准测试中的表现仍与“全精度”权重模型相似。0JY喜好网-记录每日喜好的科技时尚娱乐生活

尽管这一“概念验证”型 BitNet 模型取得了显著成功,研究人员写道,他们尚未完全理解为什么这种极简化的权重设定能使模型表现如此出色。“深入探讨大规模1-bit训练为何能奏效的理论基础仍然是一个未解之谜,”他们写道。而且,仍需要更多研究使这些 BitNet 模型在整体规模和上下文窗口“记忆”方面与当今最大的模型竞争。0JY喜好网-记录每日喜好的科技时尚娱乐生活

尽管如此,这项新研究展示了一种潜在的替代方案,适用于那些因运行在昂贵且强大的GPU上而面临硬件及能耗飙升问题的AI模型。或许现今的“全精度”模型就像浪费大量能量和资源的肌肉车,而一款精致的小型车也许就能交付类似的效果。0JY喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
那些大牌商场,正被本土商超“摁在地上摩擦”

那些大牌商场,正被本土商超“摁在

几大高奢商场在上半年的业绩都不

11-19 118阅读
戴森设计大奖国际20强名单出炉

戴森设计大奖国际20强名单出炉

【锋巢网】首次有两支中国大陆赛

11-19 124阅读
丰田公开搭载氢发动机的混合动力车,加氢一次续航约 250 公里

丰田公开搭载氢发动机的混合动力

11 月

11-19 115阅读
OPPO Reno 13 系列手机外观公布,代言人宋雨琦

OPPO Reno 13 系列手机外观公布,

11 月

11-19 113阅读
李子柒:反商业化「顶流」

李子柒:反商业化「顶流」

沉寂1

11-19 103阅读
写意锦官城(写意锦官城)

写意锦官城(写意锦官城)

写意锦官城 作者:解朝侠 一直

11-19 99阅读
人民日报评代拍乱象, 代拍为何惹众怒?

人民日报评代拍乱象, 代拍

近期除了家暴一词被大家热议,代拍

11-19 109阅读
赵薇再陷风波被强制执行8488元 公司涉400余起证券纠纷案

赵薇再陷风波被强制执行84

企查查APP显示,近日,浙江祥源文旅股份

11-19 104阅读
魔兽世界年卡来了 送筋肉鱼人 兔年坐骑,怀旧服幽冥幼龙(魔兽世界年卡来了)

魔兽世界年卡来了 送筋肉

暴雪今天早晨发布了魔兽世界最新的

11-19 97阅读
扎导又拍新片

扎导又拍新片

扎克·施

11-19 104阅读
三国群英传2秘籍大全_三国群英传2秘籍代码一览

三国群英传2秘籍大全_三国

相信熟悉三国群英传系列游戏的朋友都不

11-19 136阅读
僵尸生活2逃离僵尸岛全流程全角色超详细攻略分享(1.62版)

僵尸生活2逃离僵尸岛全流

僵尸生活2逃离僵尸岛是《僵尸生活》游

11-19 111阅读
原子之心医院区域密码房解谜攻略

原子之心医院区域密码房解

原子之心的医院区域里面有一个密码房,需

11-19 140阅读
原神失物匿于繁华任务怎么做|失物匿于繁华任务攻略

原神失物匿于繁华任务怎么

失物匿于繁华是原神须弥地区魔神主线任

11-19 125阅读
原神训练有素的考古学家隐藏成就任务攻略

原神训练有素的考古学家隐

训练有素的考古学家是须弥沙漠地区的隐

11-19 111阅读