英伟达继续努力,希望推动AI融入包括HPC在内的一切领域

8个月前 科技 61观看
摘要 本周一,英伟达发布了多款全新工具和框架,用以增强实时流体动力学模拟、计算化学、天气预报以及药物开发等任务的运行速度,而依托的正是当前大家最喜爱的流行词:AI。此番公告强调了英伟达的持续努

本周一,英伟达发布了多款全新工具和框架,用以增强实时流体动力学模拟、计算化学、天气预报以及药物开发等任务的运行速度,而依托的正是当前大家最喜爱的流行词:AI。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

此番公告强调了英伟达的持续努力,即不仅要使用其GPU加速以往长期运行在CPU之上的高性能计算(HPC)工作负载,同时要减少机器学习技术在各平台上完成这些工作负载所消耗的时间和算力。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

根据英伟达数据中心产品营销主管Dion Harris的介绍,即使是少量模糊数学元素的引入,也能给这些工作负载带来巨大的性能提升。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

在计算化学方面,英伟达表示与未经AI加速的纯GPU工作负载运行模式相比,使用其AI加速的Alchemi容器或NIM能够将1600万种化学结构的计算速度提升100倍。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

有些朋友可能不太熟悉,简而言之,NIM是英伟达的推理微服务,属于包含实现预期目标所需要的全部框架、库及依赖项的容器镜像。在推出后不久,NIM就迅速成为英伟达打包其软件产品的首选方式。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

本届SC24大会上公布的其他NIM,还包括用于CorrDiff和FourCastNet天气模型的Earth-2容器以及用于蛋白质模拟的DiffDock 2.0。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

在另一个示例中,Harris介绍了英伟达的计算机辅助工程kOmniverse蓝图,其使用多套AI模型来实现对流体动力学计算等任务的实时模拟。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

Harris宣称,“传统来讲,针对一辆汽车的模拟往往需要数周、甚至几个月的时间。”wEQ喜好网-记录每日喜好的科技时尚娱乐生活

凭借巨大的效率提升以及极低的精度损失,英伟达已经说服高性能计算软件巨头Ansys将这些框架集成到其流体模拟平台当中。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

Harris表示,“Altair、Cadence、西门子等公司正在探索如何将这些蓝图整合到自己的服务和产品当中,从而缩短设计周期。”wEQ喜好网-记录每日喜好的科技时尚娱乐生活

当然,在高性能计算中使用混合精度及AI来解决体量更大、复杂度更高的问题,其实也不算是什么新鲜事。研究气候模型的研究人员早就在关注这类方法并得到了不少前景光明的结果。然而,让更广泛的高性能计算社区转向这种思维方式,无疑更符合英伟达业务的利益定位。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

AI技术的腾飞正为英伟达的数据中心业务带来巨额收入,而这种趋势又被反映在该公司的设计决策当中。Blackwell就是典型案例,在双精度计算方面,其最新一代GPU与Superchips只能说是好坏参半。一方面,FP64矢量性能提升至45万亿次;但在矩阵数学方面,该芯片与H100和H200相比反而略有倒退。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

这也导致英伟达相对于AMD处于竞争劣势。AMD不仅为那些拒绝转型的顽派高性能计算用例制造CPU,而且其GPU和APU也承诺提供更高的性能。MI325X可以说是与英伟达Blackwell最具可比性的GPU型号,其在双精度下拥有81万亿悦铃 矢量与163万亿次矩阵计算性能。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

在另一方面,英伟达明显是通过牺牲精度的方式换取更极致的FLOPS浮点运算性能,其顶配Blackwell GPU在FP4下可提供20千万亿次算力。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

由此可见,英伟达拥有一套明确的高性能计算战略:与其在小从市场上跟AMD奋力争夺,不如说服软件供应商在适当条件下,将模糊矩阵数学和适度的双精度性能相结合往往效果更佳。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

这对英伟达来说也并不是一条新路。自从2007年首次公布CUDA以来,该公司对高性能计算社区的贡献不仅体现在超级计算领域,同时也对企业和云计算领域GPU的崛起都产生了积极影响。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

在高性能计算领域被基于CPU的架构所主导的时代,要进入该领域必须构建新的框架并调整软件以在GPU上运行。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

从各个方面来看,英伟达并没有放弃其传统战略,只是在软件的具体应用方面迸发出了更多创意,而且在对于机器学习的应用也依旧具有实效。总而言之,英伟达现阶段的思路仍然是沿用现有框架并尽一切可能加速计算。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

最新的案例就是cuPyNumeric,属于无处不在的NumPy库的“替代方案”。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

Harris表示,“NumPy是Python开发人员进行数学模型计算的基础库,目前被超过500万科学行业开发者使用,仅上个月的下载量就达到3亿次。”但他也同时承认,尽管NumPy普及度极高,但在多GPU集群中的库扩展方面却遭遇到不小的挑战。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

英伟达宣称,cuPyNumeric能够将NumPy程序自动扩展至规模更大的集群,且无需借助底层分布式计算库。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

英伟达本周还扩展了对其量子系统CUDA-Q平台中加速动态模拟的支持。Harris表示,“依托GPU对这些全面量子比特模拟进行加速,研究人员可以测试新的量子处理器设计方案。以往对50种设计迭代进行模拟可能需要一年左右的时间,但现在大家可以在不到一个小时内轻松完成。”wEQ喜好网-记录每日喜好的科技时尚娱乐生活

谷歌正是首批将CUDA-Q应用于英伟达EOS超级计算机以运行大规模量子模拟的公司之一。wEQ喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
拼多多「隐身」双十一

拼多多「隐身」双十一

纵然是在互联互通的大背景下,双十

11-19 122阅读
小米手机下次相机版本更新增加水印颜色选项,老机型也会版本迭代

小米手机下次相机版本更新增加水

11 月

11-19 113阅读
努比亚 Z70 Ultra 手机更多参数曝光,后置 50Mp 35mm 大底主摄

努比亚 Z70 Ultra 手机更多参数

11 月

11-19 111阅读
凯迪拉克公布2026款Vistiq电动SUV细节,明年上市

凯迪拉克公布2026款Vistiq电动SU

11-19 119阅读
洋咖啡,为何卖不动了?

洋咖啡,为何卖不动了?

近日,

11-19 111阅读
刘学义吴谨言新剧《春花厌》官宣,原著小说三观炸裂超虐

刘学义吴谨言新剧《春花厌

此前有消息传小说《春花厌》影视

11-19 114阅读
天生戏剧人!小演员田芯语乌镇首秀,领衔戏剧节唯一入围儿童剧《乐园》

天生戏剧人!小演员田芯语乌

  深秋,一场淅淅沥沥的小雨为江南带

11-19 108阅读
零容忍!税务部门公布3起网络主播偷税被处罚案件

零容忍!税务部门公布3起网

11月15日消息,近

11-19 109阅读
文化输出第一人!网红博主李子柒回归 时隔三年更新视频

文化输出第一人!网红博主李

11月12日消息,今

11-19 117阅读
迪士尼儿童动画或因LGBT话题停播一集:变性少年参加女子排球赛

迪士尼儿童动画或因LGBT话

据多位参与制作

11-19 108阅读
《彩虹六号:围攻》“COLLISION POINT行动”12月3日推出

《彩虹六号:围攻》“COLLIS

中国,上海– 2024年11月18日 – 今天,

11-19 130阅读
《优米雅的鍊金工房》第二波情报,新宣传片公开

《优米雅的鍊金工房》第二

活着, 就会不断地累积记忆。这是她在灭

11-19 109阅读
CS1.6怎么加机器人?CS1.6加机器人方法

CS1.6怎么加机器人?CS1.6

《CS1.6》也就是大家都玩过的反恐精英

11-19 192阅读
原子之心前期速刷神经聚合物的方法分享

原子之心前期速刷神经聚合

神经聚合物是原子之心游戏中用来解锁技

11-19 104阅读
原子之心芭蕾舞者谜题攻略_芭蕾舞者舞姿调整攻略

原子之心芭蕾舞者谜题攻略

原子之心游戏里面玩家会在剧院中碰到一

11-19 121阅读