VDURA:AI 训练和推理需要优化文件与对象存储的平衡

2个月前 科技 15观看
摘要 在存储领域,有观点认为对象存储比文件存储更适合 AI 训练和推理,这引起了广泛关注。VAST Data 的联合创始人 Jeff Denworth 和 Microsoft 的 AI 基础架构架构师 Glenn Lockwood 都支持这一观点

在存储领域,有观点认为对象存储比文件存储更适合 AI 训练和推理,这引起了广泛关注。VAST Data 的联合创始人 Jeff Denworth 和 Microsoft 的 AI 基础架构架构师 Glenn Lockwood 都支持这一观点。然而,Hammerspace 的市场高级副总裁 Molly Presley 和 VDURA 的 CEO Ken Claffey 持不同意见。RXd喜好网-记录每日喜好的科技时尚娱乐生活

VDURA 为超级计算、机构和企业级 HPC 提供并行文件系统。Ken Claffey 认为,在 AI 训练和推理市场中,文件或对象的数据访问问题被误解了。他认为两者都有其作用,并在采访中与我们讨论了这一点。RXd喜好网-记录每日喜好的科技时尚娱乐生活

Blocks & Files:是什么让您开始思考这个问题的?RXd喜好网-记录每日喜好的科技时尚娱乐生活

Ken Claffey:VAST Data 的 Jeff Denworth 最近大胆声称“没有人需要文件系统来进行 AI 训练”,而基于 S3 的对象存储是未来。虽然 AI 工作负载确实在演变,但声称文件系统已经过时是误导性的。RXd喜好网-记录每日喜好的科技时尚娱乐生活

Blocks & Files:您认为 AI 存储需求的现实是什么?并行文件系统在大规模高性能 AI 训练中扮演什么角色?RXd喜好网-记录每日喜好的科技时尚娱乐生活

Ken Claffey:在 VDURA,我们不认为 AI 存储是文件和对象之间的二选一。我们的架构以高性能对象存储为核心,前端是一个完全并行的文件系统。这意味着用户可以获得两者的最佳优势:对象存储的可扩展性和持久性,以及 AI 训练所需的高性能访问。RXd喜好网-记录每日喜好的科技时尚娱乐生活

在我们最新的 v11 版本中,我们通过集成高性能分布式键值存储进一步增强了平台。这一新增功能优化了元数据操作,并实现了超快速索引,进一步增强了 AI 和 HPC 工作负载。此外,VDURA 提供了一个高性能的 S3 接口,允许在文件和对象协议之间无缝访问相同的文件和数据。这确保了企业在扩展 AI 基础架构时的最大灵活性和投资保护。RXd喜好网-记录每日喜好的科技时尚娱乐生活

Blocks & Files:对象存储在这里有什么作用?RXd喜好网-记录每日喜好的科技时尚娱乐生活

Ken Claffey:Microsoft Azure 的 Glenn Lockwood 最近指出,大规模 AI 语言模型越来越多地使用对象存储进行训练,而不是文件存储。他的观点与向基于对象的架构的转变趋势一致,但在得出结论之前,重要的是要仔细研究 AI 训练工作流程的细微差别。RXd喜好网-记录每日喜好的科技时尚娱乐生活

Lockwood 列出了 AI 模型训练的四个主要阶段:RXd喜好网-记录每日喜好的科技时尚娱乐生活

数据摄取:收集大量非结构化数据,适合对象存储,因为它具有不变性和可扩展性。RXd喜好网-记录每日喜好的科技时尚娱乐生活

数据准备:转换和清理数据,这主要是一个内存和分析驱动的任务。RXd喜好网-记录每日喜好的科技时尚娱乐生活

模型训练:通过 GPU 运行 Token 化数据并检查模型权重,需要快速存储访问。RXd喜好网-记录每日喜好的科技时尚娱乐生活

模型部署和推理:分发训练好的模型并处理实时查询,通常通过键值存储进行优化。RXd喜好网-记录每日喜好的科技时尚娱乐生活

虽然 Lockwood 认为这些工作负载不需要并行文件系统,但他的论点主要围绕成本效益而非原始性能。对象存储因其规模和成本效益而适合数据摄取和准备。然而,对于模型训练和实时推理,像 VDURA 这样的混合方法能提供最佳的解决方案。RXd喜好网-记录每日喜好的科技时尚娱乐生活

Blocks & Files:您认为 Nvidia 在这方面的观点是什么?RXd喜好网-记录每日喜好的科技时尚娱乐生活

Ken Claffey:随着他们发布下一代 GPU 和 DGX 平台,他们继续强调高性能存储需求。根据 Nvidia 自己对 DGX 的指导意见,领先的 AI 平台推荐的存储配置是:RXd喜好网-记录每日喜好的科技时尚娱乐生活

“高性能、可靠的、POSIX 风格的文件系统,优化用于多线程读写操作,跨多个节点。”RXd喜好网-记录每日喜好的科技时尚娱乐生活

我们是否遗漏了 S3 的要求?Nvidia 并未表示 AI 训练应仅依赖对象存储。事实上,他们自己的高性能 AI 架构是围绕为多线程、高吞吐量访问而设计的文件系统构建的。RXd喜好网-记录每日喜好的科技时尚娱乐生活

Blocks & Files:检查点是否鼓励使用对象存储?RXd喜好网-记录每日喜好的科技时尚娱乐生活

Ken Claffey:Denworth 提到 Nvidia 的“S3 Checkpointer”作为 AI 训练转向对象存储的证据。然而,他方便地忽略了一个关键细节。Nvidia 自己文档的下一部分指出:“异步功能目前不检查先前的异步保存是否完成,因此即使当前保存失败,也可能会删除旧的检查点。”RXd喜好网-记录每日喜好的科技时尚娱乐生活

这在实践中意味着什么?使用异步检查点可能导致恢复点更早。这大大降低了检查点的可靠性,并增加了训练进度丢失的风险。同步、一致的检查点的价值不容小觑——这是并行文件系统经过数十年优化的内容。RXd喜好网-记录每日喜好的科技时尚娱乐生活

Blocks & Files:您如何优化 VDURA 存储?RXd喜好网-记录每日喜好的科技时尚娱乐生活

Ken Claffey:与其将争论框架为“文件与对象”,VDURA 构建了一个集成解决方案:RXd喜好网-记录每日喜好的科技时尚娱乐生活

一个高性能对象存储,以高效处理大规模数据摄取和归档。RXd喜好网-记录每日喜好的科技时尚娱乐生活

一个完全并行的文件系统前端,以低延迟、高带宽访问优化 AI 模型训练。RXd喜好网-记录每日喜好的科技时尚娱乐生活

一个分布式键值存储,加速元数据查找、向量索引和推理。RXd喜好网-记录每日喜好的科技时尚娱乐生活

一个高性能 S3 接口,确保跨 AI 工作流的多协议访问。RXd喜好网-记录每日喜好的科技时尚娱乐生活

这种架构解决了 Lockwood 的担忧,同时也满足了企业对最高性能和可扩展性的需求。虽然对象存储发挥了关键作用,但完全忽视并行文件系统无视了大规模 AI 训练的实际情况。RXd喜好网-记录每日喜好的科技时尚娱乐生活

Blocks & Files:您如何看待 AI 存储的未来?RXd喜好网-记录每日喜好的科技时尚娱乐生活

Ken Claffey:Denworth 和 Lockwood 都为对象存储提出了强有力的理由,但他们淡化了 AI 训练中性能关键的方面。AI 存储的未来是混合的:RXd喜好网-记录每日喜好的科技时尚娱乐生活

并行文件系统提供训练所需的速度和效率。RXd喜好网-记录每日喜好的科技时尚娱乐生活

对象存储适用于归档、共享和检索工作负载。RXd喜好网-记录每日喜好的科技时尚娱乐生活

多协议解决方案弥合了差距,但这并不意味着文件系统已过时——远非如此。RXd喜好网-记录每日喜好的科技时尚娱乐生活

高性能分布式键值存储增强了元数据管理和索引,进一步优化了 AI 工作流。RXd喜好网-记录每日喜好的科技时尚娱乐生活

VDURA 的方法承认了这一现实:以高性能对象存储为核心,一个完全并行的文件系统前端,一个集成的键值存储,以及一个高性能 S3 接口——所有这些共同作用,以提供无与伦比的 AI 和 HPC 工作负载效率。与 VAST 声称对象存储是未来的观点不同,我们认识到大规模 AI 训练需要所有存储范式的最佳组合。RXd喜好网-记录每日喜好的科技时尚娱乐生活

在大规模部署 AI 的企业需要一个真正满足性能要求的存储基础架构,而不仅仅是理论上的灵活性。虽然对象存储发挥了作用,但并行文件系统仍然是高性能 AI 基础架构的支柱,提供了当今 AI 工作负载所需的速度、一致性和规模。RXd喜好网-记录每日喜好的科技时尚娱乐生活

行业并没有远离文件系统——它正在演变以拥抱最佳的技术组合。问题不是“文件或对象”,而是“我们如何优化?”在 VDURA,我们正在以这种平衡为基础构建 AI 存储的未来。RXd喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
董宇辉终究难逃宿命

董宇辉终究难逃宿命

直播带货业已进入到一场深度洗牌

11-19 74阅读
天玑9400性能之神!iQOO Neo10系列前瞻

天玑9400性能之神!iQOO Neo10系列

今天,iQOO

11-19 65阅读
‌上汽奥迪首款B级车型将明年年中发布‌

‌上汽奥迪首款B级车型将明年年

11-19 65阅读
焦虑的开发者,涌向“纯血鸿蒙”培训班

焦虑的开发者,涌向“纯血鸿蒙”培

有两

11-19 64阅读
东方树叶们的「备胎上位史」

东方树叶们的「备胎上位史」

中国

11-19 70阅读
李诞真名叫什么? 误打误撞踏入演艺圈!

李诞真名叫什么? 误打误撞

《吐槽大会》第四季第一集播出之

11-19 70阅读
《令人心动的offer6》:职综天花板如何让英雄主义落地现实

《令人心动的offer6》:职综

  《令人心动的offer》第六季以豆瓣

11-19 65阅读
长江文化艺术季闭幕式圆满落幕 平安携手金莎合唱《何以家国》

长江文化艺术季闭幕式圆满

  4日晚,长江文化艺术季闭幕式在宜昌

11-19 67阅读
时隔3年正式回归连更2条作品 李子柒:还有存货正在剪

时隔3年正式回归连更2条作

11月12日消息,时

11-19 58阅读
肖战演郭靖!新《射雕》能复兴徐克的武侠梦吗 网友:肩负文化出海重任

肖战演郭靖!新《射雕》能复

11月18日消息,由

11-19 67阅读
AI技术将一峰大二原作动画《電人アロー》黑白影像彩色化

AI技术将一峰大二原作动画

由一峰大

11-19 71阅读
《啪嗒砰》精神续作《Ratatan》新预告片分享

《啪嗒砰》精神续作《Rata

Game Source Entertainment 宣布与开

11-19 66阅读
三国群英传7秘籍大全_三国群英传7所有秘籍代码一览

三国群英传7秘籍大全_三国

三国群英传7游戏支持秘籍功能,玩家可以

11-19 64阅读
卧龙苍天陨落怎么提升武将好感度?提升武将好感度的方法分享

卧龙苍天陨落怎么提升武将

卧龙苍天陨落怎么提升武将好感度?在卧龙

11-19 67阅读
原神疗养观察任务流程|原神疗养观察攻略

原神疗养观察任务流程|原

原神疗养观察是游戏中须弥地区魔神任务

11-19 67阅读