Alluxio 提升 AI 模型训练性能

3个月前 科技 19观看
摘要 Alluxio Inc.(一家销售开源分布式文件系统和缓存商业版本的公司)今天宣布推出新功能,加快人工智能模型训练速度并增强与 Python 软件开发工具包的集成。该公司表示,这些更新能够让组织更快地训练

Alluxio Inc.(一家销售开源分布式文件系统和缓存商业版本的公司)今天宣布推出新功能,加快人工智能模型训练速度并增强与 Python 软件开发工具包的集成。w7s喜好网-记录每日喜好的科技时尚娱乐生活

该公司表示,这些更新能够让组织更快地训练模型、更高效地处理大型数据集,并简化复杂的 AI 基础设施。w7s喜好网-记录每日喜好的科技时尚娱乐生活

Alluxio 表示,这些增强功能旨在支持对重要训练数据的快速、优先访问,并与常用的 AI 框架集成。该公司已经转向解决可能需要数月时间的 AI 模型训练问题,承诺带来显著的性能提升。"我们将 DeepSeek 视为一个机会,"创始人兼首席执行官 Haoyuan Li 表示,他提到的这家中国初创公司本周因其低成本模型训练方法导致科技股下跌。"这为我们创造了更容易的销售机会。"w7s喜好网-记录每日喜好的科技时尚娱乐生活

去年 7 月,该公司宣布其增强功能可以将昂贵的图形处理单元利用率提高到 97%。市场和产品营销副总裁 Bill Hodak 表示:"每个人都在快速行动以利用 AI,所以我们帮助他们更快创新,加速训练工作负载,更快地将模型推向市场,了解它们的使用情况,并将这些信息反馈到模型训练过程中。他们做这些事情越快,他们的模型就会越先进、越准确。"w7s喜好网-记录每日喜好的科技时尚娱乐生活

快速缓存w7s喜好网-记录每日喜好的科技时尚娱乐生活

Alluxio Enterprise AI 3.5 版本包含一个实验性的 CACHE_ONLY 写入模式,据称该模式显著提升了写入操作的性能。启用时,该模式将数据仅写入 Alluxio 缓存而不是底层文件系统,从而消除了存储系统相关的瓶颈。w7s喜好网-记录每日喜好的科技时尚娱乐生活

Hodak 表示,该功能对检查点文件特别有用。检查点文件是模型在特定时间点的状态快照,可用于从保存点恢复,而不是从头重新开始。Hodak 说,这些文件可能很大,在加载过程中会导致训练过程出现长时间延迟。"如果之前需要一个小时,现在可能只需要 20 分钟。"w7s喜好网-记录每日喜好的科技时尚娱乐生活

高级缓存清除允许管理员对缓存数据强制执行生存时间设置,该设置定义了缓存数据在自动过期和删除之前保持有效的时间。管理员现在可以为特定数据定义缓存优先级,覆盖 Alluxio 的默认"最近最少使用"算法,以保留原本会被清除的数据。w7s喜好网-记录每日喜好的科技时尚娱乐生活

"目标是尽可能减少开销,"Hodak 说。"这提高了缓存命中率,具体取决于工作负载。"w7s喜好网-记录每日喜好的科技时尚娱乐生活

另一个实验性功能是增强了 Alluxio 的 Python SDK 与流行 AI 框架(如 PyTorch、PyArrow 和 Ray)之间的集成。这些集成提供了统一的 Python 文件系统接口,使应用程序能够与本地和远程存储系统无缝交互。w7s喜好网-记录每日喜好的科技时尚娱乐生活

更快的 S3 访问w7s喜好网-记录每日喜好的科技时尚娱乐生活

此版本还对 Alluxio 访问 S3 对象存储的应用程序编程接口进行了多项增强。w7s喜好网-记录每日喜好的科技时尚娱乐生活

HTTP 持久连接支持为多个请求维护单个 TCP 连接。这减少了为每个请求打开新连接的开销,并将 4KB S3 ReadObject 请求的延迟降低了约 40%。w7s喜好网-记录每日喜好的科技时尚娱乐生活

Alluxio S3 API 与 Alluxio worker 之间的通信现在支持 TLS 加密和分段上传。后者将文件分成多个部分以实现更快的并行上传。w7s喜好网-记录每日喜好的科技时尚娱乐生活

Hodak 表示,新的缓存服务提高了超大目录列表的性能,通过从缓存提供目录列表元数据,使结果的传递速度提高了五倍。w7s喜好网-记录每日喜好的科技时尚娱乐生活

管理员现在可以设置速率限制,以控制单个 Alluxio Worker 从底层文件系统(Alluxio 用于存储缓存访问数据的底层存储系统)读取的最大带宽。w7s喜好网-记录每日喜好的科技时尚娱乐生活

集群现在可以具有具有异构 CPU、内存、磁盘和网络配置的工作节点,从而增强了灵活性。w7s喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
年轻人的失眠症,正在被包装成“熬夜经济”

年轻人的失眠症,正在被包装成“熬

最近一段时间,各大奶茶店纷纷开启

11-19 68阅读
外媒:英伟达新款Blackwell AI芯片面临过热问题,或致数据中心部署延期

外媒:英伟达新款Blackwell AI芯片

11月1

11-19 63阅读
小米第三季度研发费用60亿 雷军:小米坚持技术为本的铁律

小米第三季度研发费用60亿 雷军:

11月19日

11-19 64阅读
辽宁省40+高校升级5.5G:上传提升2倍 下载快4.2Gbps

辽宁省40+高校升级5.5G:上传提升2

11月18日

11-19 71阅读
割不动贵妇,燕窝盯上男总裁

割不动贵妇,燕窝盯上男总裁

消费

11-19 69阅读
味道研究所 | 橘黄变棕红 这口Q糯甜香深深烙印在你心间(味道研究所橘黄变棕红)

味道研究所 | 橘黄变棕红

© |菜头 遂昌乡村有着独特的

11-19 70阅读
要回归了?李奈映透露丈夫元斌正在选剧本 有望复出拍戏

要回归了?李奈映透露丈夫元

47岁韩国男星元斌,凭着帅气

11-19 63阅读
NCT DREAM正辑四辑《DREAMSCAPE》登上韩国国内各大专辑周榜一位

NCT DREAM正辑四辑《DREAM

11月11日发行的NCT DREAM正辑

11-19 65阅读
全球部长大使论坛在澳门举行,共同探讨国际电影合作新方向

全球部长大使论坛在澳门举

  近日,上汽大众帕萨特Pro之夜第二

11-19 63阅读
《扫黑风暴》郑毅红结局是什么?她最后有没有落网?

《扫黑风暴》郑毅红结局是

电视剧《扫黑风暴》郑毅红结局是

11-19 63阅读
饥荒联机版怎么调中文?饥荒联机版中文设置方法

饥荒联机版怎么调中文?饥荒

饥荒联机版是目前很多玩家在玩的一个版

11-19 72阅读
小小突击队礼包码,小小突击队周年礼包码2023.9

小小突击队礼包码,小小突击

小小突击队礼包码来啦!这次为大家带来的

11-19 65阅读
原神尽在咫尺的目标任务怎么做|尽在咫尺的目标任务攻略

原神尽在咫尺的目标任务怎

尽在咫尺的目标是原神须弥地区魔神主线

11-19 65阅读
原神林中遇变任务怎么做?原神林中遇变主线攻略

原神林中遇变任务怎么做?

林中遇变是原神须弥地区魔神主线任务的

11-19 63阅读
饥荒龙心怎么获得?饥荒快速获得龙心的技巧分享

饥荒龙心怎么获得?饥荒快

龙心是饥荒游戏里面的重要材料,可以从龙

11-19 67阅读