re:Invent 2024:亚马逊云科技在AI时代“芯”洞未来 原创

8个月前 科技 55观看
摘要 今年,瘦身成功的亚马逊云科技高级副总裁Peter DeSantis,用生成式AI亲手创作了几张re:Invent《周一晚间直播》的配图,来可视化他的演讲。这也为整场活动定下了基调,其实亚马逊云科技在底层创新上

今年,瘦身成功的亚马逊云科技高级副总裁Peter DeSantis,用生成式AI亲手创作了几张re:Invent《周一晚间直播》的配图,来可视化他的演讲。hUr喜好网-记录每日喜好的科技时尚娱乐生活

这也为整场活动定下了基调,其实亚马逊云科技在底层创新上一直有着悠久的历史,从芯片设计到计算架构,再到AI加速,每一步都在推动技术边界的发展。hUr喜好网-记录每日喜好的科技时尚娱乐生活

re:Invent 2024:亚马逊云科技在AI时代“芯”洞未来hUr喜好网-记录每日喜好的科技时尚娱乐生活

亚马逊云科技高级副总裁Peter DeSantishUr喜好网-记录每日喜好的科技时尚娱乐生活

自研芯片的技术版图hUr喜好网-记录每日喜好的科技时尚娱乐生活

亚马逊云科技已经拥有超过十年“自研芯片”的历程,已推出的四大自研芯片产品组合包括:六代Nitro系统、四代Graviton、两代Trainium和Inferentia。hUr喜好网-记录每日喜好的科技时尚娱乐生活

亚马逊云科技在2018年re:Invent大会上发布了基于ARM架构的第一代Amazon Graviton。此后,Graviton芯片不断针对现实的工作负载进行性能优化:第二代专注于横向扩展性能,第三代聚焦高计算需求的专业工作负载,而第四代则成为专为云计算打造的性能最强芯片。hUr喜好网-记录每日喜好的科技时尚娱乐生活

Peter DeSantis指出,过去两年间,新投产的CPU算力中有超过50%运行在Amazon Graviton上。hUr喜好网-记录每日喜好的科技时尚娱乐生活

与此同时,AWS Nitro System重新定义了服务器架构,从根本上革新了云的构建和保护云的方式。AWS也将AWS Nitro System的安全性拓展到Amazon Graviton4,通过两者的结合,打造出亚马逊云科技迄今为止最安全的计算产品之一。hUr喜好网-记录每日喜好的科技时尚娱乐生活

AI加速器的硬核进化hUr喜好网-记录每日喜好的科技时尚娱乐生活

Trainium加速器不属于传统的CPU或GPU,其采用了脉动阵列架构,是专门针对AI工作负载优化过的硬件架构。hUr喜好网-记录每日喜好的科技时尚娱乐生活

“人工智能工作负载不是横向扩展型的工作负载,而是扩张类型的工作负载。”Peter DeSantis说道。亚马逊云科技采用“扩张”的方式,专注于提高单个系统的容量,而不是采用“横向扩展”的方式,构建多个相同的系统,在多台机器上分配工作负载。hUr喜好网-记录每日喜好的科技时尚娱乐生活

在传统CPU和GPU中,每个计算步骤通常需要从内存读取数据、执行计算后,再将结果写回内存。这种频繁的内存操作会导致性能瓶颈,尤其是在需要大量带宽的AI任务中。hUr喜好网-记录每日喜好的科技时尚娱乐生活

脉动阵列设计目的是高效处理大规模的矩阵或张量运算,脉动阵列通过将计算结果直接从一个处理单元传递到下一个处理单元,减少了对内存的访问需求,从而降低了内存带宽的压力。hUr喜好网-记录每日喜好的科技时尚娱乐生活

re:Invent 2024:亚马逊云科技在AI时代“芯”洞未来hUr喜好网-记录每日喜好的科技时尚娱乐生活

Trainium2 Server也得益于此,其是目前亚马逊云科技最强大的机器学习服务器,其扩张的速度也超过了曾经所有的服务器。现场还第一次展示了AWS Trainium2 UltraServer,其设置2个机架、4个服务器和64个Trainium加速器,以超高速的NeuronLink连接在一起。AWS Trainium2 UltraServer提供相比当前EC2 AI服务器多达5倍的计算容量和10倍的内存,算力峰值扩展到83.2PFLOPS。hUr喜好网-记录每日喜好的科技时尚娱乐生活

re:Invent 2024:亚马逊云科技在AI时代“芯”洞未来hUr喜好网-记录每日喜好的科技时尚娱乐生活

同时推出全新Trainium3,其采用3nm制程的芯片,与上代Trainium2相比,计算能力增加2倍,能源效率提升40%。Trainium3专为满足下一代生成式AI工作负载的高性能需求而设计,有助客户更快地建立更大的模型,由Trainium3驱动的UltraServers预计将比 AWS Trainium2 UltraServer的效能高出四倍。hUr喜好网-记录每日喜好的科技时尚娱乐生活

亚马逊云科技同时也注意到推理性能优化的关键性需求,宣布了Latency-optimized inference option for Amazon Bedrock,使各种模型可以获得最佳的推理性能。借助这一优化,Claude 3.5 Haiku在亚马逊云科技上的运行速度比其他平台快了60%。hUr喜好网-记录每日喜好的科技时尚娱乐生活

AI生态的未来棋局hUr喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic 从成立那天起,就靠着前沿的 AI 技术圈足了眼球。11 月 23 日,亚马逊再度追加40亿美元投资,使总投资推高到80亿。这可不只是砸钱,而是在下一盘关于AI未来的大棋。hUr喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic快速发展的背后,离不开亚马逊云科技的强大技术支撑。其Amazon Trainium和 Amazon Inferentia芯片,不仅显著提升了Claude模型的训练和推理性能,还显著降低了成本。11月4日,Claude 3.5 Haiku也在Amazon Bedrock中正式可用。hUr喜好网-记录每日喜好的科技时尚娱乐生活

Anthropic还在《周一晚间直播》中宣布了Project Rainier项目,计划在数百个Amazon Trainium 集群上进行训练,构建出更快的、更可扩展的AI,以支持Anthropic的未来模型开发。hUr喜好网-记录每日喜好的科技时尚娱乐生活

亚马逊云科技还有很多底层基础架构的创新,从性能提升到成本降低,每一项突破都在重新定义AI的技术边界。hUr喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
华为强机皇!Mate 70系列关键信息汇总:外观/性能/影像揭秘

华为强机皇!Mate 70系列关键信息

华为Mate

11-19 117阅读
摸着Meta过河,百度再战AI眼镜

摸着Meta过河,百度再战AI眼镜

“Goo

11-19 109阅读
又一百亿独角兽申请破产了

又一百亿独角兽申请破产了

近日,

11-19 147阅读
投中的播客栏目,叫“大北窑14F”

投中的播客栏目,叫“大北窑14F”

投中

11-19 125阅读
致命错误!Sam Altman发一张对比图,遭到大量吐槽

致命错误!Sam Altman发一张对比图

图片来源:由无界AI生成OpenAI联合

11-19 131阅读
“骗”来30+喜剧人,《大话大话西游》好一场内容共创|Talk专访蒋龙

“骗”来30+喜剧人,《大话大

作者 / 张   特采访、编辑 / 朱 

11-19 109阅读
毒铁锅 遭央视多次曝光,把美食变成 毒药 ,大家应提高警惕(遭央视多次曝光)

毒铁锅 遭央视多次曝光,把

前言 前一段时间,我国市面上出现了

11-19 105阅读
刘学义吴谨言新剧《春花厌》官宣,原著小说三观炸裂超虐

刘学义吴谨言新剧《春花厌

此前有消息传小说《春花厌》影视

11-19 114阅读
高燃励志电影《倒数回击》定档11月20日 甜妹热辣“爆改”逆袭浴火人生

高燃励志电影《倒数回击》

  由洪子烜导演,温贞菱、丁宁主演的

11-19 98阅读
《好东西》豆瓣9.1,放映时观众数次鼓掌,导演:桥段全靠硬编

《好东西》豆瓣9.1,放映时

邵艺辉自编自导,宋佳、钟楚曦、章宇、

11-19 128阅读
不能现实换钱的新型NFC?《宝可梦卡牌P》再创新热潮

不能现实换钱的新型NFC?《

近期《宝可梦卡牌P》APP正式推出,引发

11-19 133阅读
重装机兵4失落密码大全_重装机兵4所有失落密码一览

重装机兵4失落密码大全_重

失落密码是《重装机兵4》游戏里面的一

11-19 318阅读
卧龙苍天陨落在哪强化装备?卧龙苍天陨落强化装备位置介绍

卧龙苍天陨落在哪强化装备

卧龙苍天陨落在哪强化装备?卧龙苍天陨落

11-19 119阅读
原神已然来临的花神诞祭任务攻略

原神已然来临的花神诞祭任

原神已然来临的花神诞祭是原神须弥地区

11-19 124阅读
饥荒通过卡猪人快速回复san值的详细操作方法

饥荒通过卡猪人快速回复sa

饥荒游戏里面玩家经常会面对san值不足

11-19 136阅读