Microsoft 提出管理保留内存技术以应对 AI 工作负载

6个月前 科技 28观看
摘要 Microsoft 研究人员提出了一种名为管理保留内存 (MRM) 的新概念 - 这是一种具有短期持久性的存储级内存 (SCM),专门针对 AI 基础模型工作负载进行 IO 优化。Microsoft 首席研究软件工程师 Ser

Microsoft 研究人员提出了一种名为管理保留内存 (MRM) 的新概念 - 这是一种具有短期持久性的存储级内存 (SCM),专门针对 AI 基础模型工作负载进行 IO 优化。G0A喜好网-记录每日喜好的科技时尚娱乐生活

Microsoft 首席研究软件工程师 Sergey Legtchenko 和其他研究人员在 Arxiv 上发表的论文中描述了 MRM,旨在解决 AI 集群中高带宽内存 (HBM) 的局限性。他们指出,HBM "由于多个原因对 AI 工作负载来说并不理想",它"在写入性能方面过度配置,但在密度和读取带宽方面配置不足,同时每比特能耗显著。由于制造复杂性,其成本也很高,良率低于 DRAM。"G0A喜好网-记录每日喜好的科技时尚娱乐生活

研究人员表示,SCM 方案 - 如英特尔已停产的 Optane 以及潜在的 MRAM、ReRAM 或 PCM (相变存储器) 替代方案 - 都假定在内存 (需要持续供电刷新以保留数据的易失性 DRAM) 和存储 (长期保存数据,以年计) 之间存在明显的界限。G0A喜好网-记录每日喜好的科技时尚娱乐生活

他们说:"这些技术传统上提供长期持久性 (10 年以上),但 IO 性能和/或耐久性较差。" 例如:"闪存单元的保留时间超过 10 年,但这是以牺牲每个存储单元的读写吞吐量为代价的,相比 DRAM 要低。这些特性意味着 DRAM 用作处理器的内存,而闪存用于二级存储。"G0A喜好网-记录每日喜好的科技时尚娱乐生活

但从保留时间来看,这种界限实际上不必如此明显。保留时间存在一个从零到数十年甚至更长的连续谱。DRAM 在需要刷新之前确实会短暂保留数据。研究人员写道:"非易失性是存储设备的一个关键属性,但在存储单元层面上这个概念其实具有误导性。对所有技术而言,存储单元只是提供一个保留时间,这是一个从 DRAM 的微秒到多年的连续体。"G0A喜好网-记录每日喜好的科技时尚娱乐生活

通过默认支持这种明显的内存-存储分界概念,"支撑 SCM 的技术被迫要实现非易失性,要求其保留时间达到十年或更长。不幸的是,实现这种高保留时间需要在写入和读取延迟、能源效率和耐久性等其他指标上做出权衡。"G0A喜好网-记录每日喜好的科技时尚娱乐生活

对于像推理这样的 AI 工作负载来说,具有非易失性的通用 SCM 是不必要的。这类工作负载需要高性能的模型权重和 KV 缓存数据顺序读取,但写入性能要求较低。由于此类工作负载规模巨大,需要一个新的内存类别,因为 HBM 的每比特读取能耗太高,而且"成本高昂,良率挑战显著"。G0A喜好网-记录每日喜好的科技时尚娱乐生活

Microsoft 研究人员表示,他们理论上的 MRM "与易失性 DRAM 不同,它可以在断电时保留数据,且不会在频繁的单元刷新中浪费能量,但与 SCM 不同,它并不针对长期保留时间。由于大多数推理数据无需长期保存,保留时间可以放宽到几天或几小时。作为回报,MRM 具有更好的耐久性,并致力于在读取吞吐量、能源效率和容量等关键指标上超越 DRAM (和 HBM)。"G0A喜好网-记录每日喜好的科技时尚娱乐生活

他们指出:"由于 IO 是大规模且顺序的,因此不需要字节寻址",这表明块寻址结构就足够了。G0A喜好网-记录每日喜好的科技时尚娱乐生活

研究人员正在理论上定义一个新的内存类别,表示在内存-存储层次结构中存在一个特定于 AI 基础模型的空白,可以用适当的半导体技术来填补。这"为这一应用领域开启了更好内存的计算机架构研究领域。"G0A喜好网-记录每日喜好的科技时尚娱乐生活

论文中的图表"显示了现有内存/存储技术的耐久性与工作负载耐久性要求之间的比较。在适用的情况下,我们区分了现有设备中观察到的耐久性和技术所展示的潜力。"耐久性是指可以持续进行写入循环的时间长度。"HBM 在耐久性方面过度配置,而现有的 SCM 设备虽然不能满足耐久性要求,但底层技术具有实现这一目标的潜力。"G0A喜好网-记录每日喜好的科技时尚娱乐生活

Microsoft 研究人员表示:"我们明确不局限于特定技术,而是强调一个机会空间。这是对从研究底层存储单元技术的人员,到思考内存控制器的人员,再到设计访问内存的软件系统的人员的行动召唤。为 AI 时代更好的内存而展开跨层级协作。"G0A喜好网-记录每日喜好的科技时尚娱乐生活

他们总结道:"我们提出了一种可以与 HBM 共存的新型内存类别 - 管理保留内存 (MRM),它能够利用最初为 SCM 提出的内存技术,但通过权衡保留时间和写入吞吐量等指标,来改善这些 AI 工作负载所需的关键性能指标。通过放宽保留时间要求,MRM 有可能让现有提出的 SCM 技术提供更好的读取吞吐量、能源效率和密度。我们希望这篇论文能够真正开启对存储单元技术和内存芯片设计创新的新思维,专门针对 AI 推理集群的需求。"G0A喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
小杨哥缺席,抖音还能玩转双11吗?

小杨哥缺席,抖音还能玩转双11吗?

采写/尹冰雪‍编辑/万天南“

11-19 133阅读
明星为何争做探店顶流?

明星为何争做探店顶流?

采写/陈纪英编辑/万天南明星的尽头

11-19 140阅读
比亚迪造出的第一款实车“316”亮相,王传福称第二天就砍掉了

比亚迪造出的第一款实车“316”

11 月

11-19 130阅读
苹果史上薄机型!曝iPhone 17 Air厚度仅6mm

苹果史上薄机型!曝iPhone 17 Air

11月19日

11-19 113阅读
奔驰新款EQE 500 4MATIC纯电轿车上市:售47.8万起,全系四驱

奔驰新款EQE 500 4MATIC纯电轿车

11-19 123阅读
消失三年的李子柒,要跟全网“唱反调”!

消失三年的李子柒,要跟全网

11-19 113阅读
深入人心的人生句子,精致有个性,总有一句适合你(深入人心的人生句子)

深入人心的人生句子,精致有

一、 人生没有多走的路,脚下的每

11-19 107阅读
徐璐发文疑似分, 原来是误会一场!

徐璐发文疑似分, 原来是误

徐璐和张铭恩的恋情自从搬上节目

11-19 105阅读
综艺《开播!短剧季》试镜最后一役!谁能夺得《包拯与公孙策》IP试播资格?

综艺《开播!短剧季》试镜最

  国内首档“微短剧+综艺”创新真人

11-19 114阅读
电视剧《三大队》今日开播,秦昊演刑警队长程兵

电视剧《三大队》今日开播

由张译领衔主演,王骁、曹炳琨、魏

11-19 126阅读
2024年真实有效能赚钱的app有哪些?盘点赚钱软件app排行榜前十名!

2024年真实有效能赚钱的ap

随着移动互联网的快速发展,赚钱的方式也

11-19 358阅读
不能现实换钱的新型NFC?《宝可梦卡牌P》再创新热潮

不能现实换钱的新型NFC?《

近期《宝可梦卡牌P》APP正式推出,引发

11-19 133阅读
文明6秘籍大全_文明6秘籍代码及使用方法一览

文明6秘籍大全_文明6秘籍

文明6游戏支持秘籍功能,玩家可以通过在

11-19 138阅读
大掌门2最强阵容_大掌门2最新最强阵容

大掌门2最强阵容_大掌门2

大掌门2是一款以武侠为背景的RPG动作手

11-19 129阅读
在360安装目录创建exe文件提示目标文件夹访问被拒绝的解决方法

在360安装目录创建exe文件

最近有网友反映,自己想要在360安全卫士

11-19 161阅读