Nvidia 发布 NeMo 微服务 助力简化 AI 代理开发

1周前 科技 1观看
摘要 Nvidia 宣布其 NeMo 微服务现已全面发布,为企业提供工具,以构建能够与业务系统集成且通过数据交互持续改进的 AI 代理。此项微服务的推出正值各组织迫切寻求能够为重大科技投资带来可量化回报

Nvidia 宣布其 NeMo 微服务现已全面发布,为企业提供工具,以构建能够与业务系统集成且通过数据交互持续改进的 AI 代理。此项微服务的推出正值各组织迫切寻求能够为重大科技投资带来可量化回报的具体 AI 实施策略之时。vHC喜好网-记录每日喜好的科技时尚娱乐生活

企业 AI 面临数据整合挑战 企业在采用 AI 技术时面临一大关键挑战:构建能够通过不断学习业务数据来保持准确性与实用性的系统。NeMo 微服务通过打造 Nvidia 所描述的 “数据飞轮” (data flywheel)来应对这一挑战,使 AI 系统能够通过持续接触企业信息及用户交互保持相关性。vHC喜好网-记录每日喜好的科技时尚娱乐生活

该全新工具包包含五项核心微服务:vHC喜好网-记录每日喜好的科技时尚娱乐生活

NeMo Customizer 负责对大语言模型进行微调,以实现更高的训练吞吐量。vHC喜好网-记录每日喜好的科技时尚娱乐生活

NeMo Evaluator 提供针对定制基准的简化 AI 模型评估。vHC喜好网-记录每日喜好的科技时尚娱乐生活

NeMo Guardrails 实施安全控制,确保合规并输出适当的响应。vHC喜好网-记录每日喜好的科技时尚娱乐生活

NeMo Retriever 实现跨企业系统的信息访问。vHC喜好网-记录每日喜好的科技时尚娱乐生活

NeMo Curator 处理与整理用于模型训练及改进的数据。vHC喜好网-记录每日喜好的科技时尚娱乐生活

这些组件协同工作,打造出能够作为数字同事独立执行任务、仅需极少人工监管的 AI 代理。与传统的聊天机器人不同,这些代理能够自主采取行动并基于企业数据做出决策,它们可连接现有系统,以访问信息存储在组织内部的最新数据。vHC喜好网-记录每日喜好的科技时尚娱乐生活

技术架构支持持续改进 NeMo 与 Nvidia 推理微服务(命名为 NIMs)之间的区别在于其互补功能。正如 Nvidia 企业级生成式 AI 软件部高级总监 Joey Conway 所言,“NIMs 用于推理部署——运行模型、问题输入、答复输出,而 NeMo 则专注于如何改进该模型:数据准备、训练技术、评估。”当 NeMo 完成了模型的优化后,可通过 NIM 部署到生产环境中。vHC喜好网-记录每日喜好的科技时尚娱乐生活

早期实践已展示了显著的商业效果。电信软件供应商 Amdocs 利用 NeMo 微服务开发了三个专用代理;AT&T 与 Arize 及 Quantiphi 合作,构建了一个每周更新近 10,000 份文档的代理;而 Cisco 的 Outshift 部门与 Galileo 合作,创建了一款响应速度快于同类工具的编程助手。vHC喜好网-记录每日喜好的科技时尚娱乐生活

这些微服务以 Docker 容器形式运行,并通过 Kubernetes 进行编排,从而实现可在多种计算环境中的部署。它们支持包括 Meta 的 Llama、Microsoft 的 Phi 系列、Google 的 Gemma 及 Mistral 在内的多种 AI 模型,Nvidia 自家的侧重推理能力的 Llama Nemotron Ultra 亦与该系统兼容。vHC喜好网-记录每日喜好的科技时尚娱乐生活

这一发布进入了一个竞争激烈的市场,企业在 AI 开发选择上众多,包括 Amazon 的 Bedrock、Microsoft 的 Azure AI Foundry、Google 的 Vertex AI、Mistral AI、Cohere 以及 Meta 的 Llama 技术栈。Nvidia 则通过与自身硬件生态系统的深度整合以及通过 AI Enterprise 软件平台提供的企业级支持,在众多方案中脱颖而出。vHC喜好网-记录每日喜好的科技时尚娱乐生活

Nvidia NeMo 与企业 AI 采纳 对于技术团队而言,这些微服务提供了降低实施复杂性的基础设施。容器化方法使得在内部部署或云环境中都能利用企业级的安全性及稳定性特性。这种灵活性有效应对了 AI 实施过程中经常碰到的数据主权与监管合规性问题。vHC喜好网-记录每日喜好的科技时尚娱乐生活

在评估这些工具时,组织应考虑现有 GPU 基础设施投资、数据治理需求以及与现有系统的整合需求。对于在业务数据不断变化中仍能保持准确性的 AI 代理的需求,将推动支持持续学习周期的平台的广泛应用。vHC喜好网-记录每日喜好的科技时尚娱乐生活

这种微服务方法反映了整个行业向模块化 AI 系统转变的趋势,这类系统能够为特定业务领域量身定制,而无需重构基础组件。对技术决策者而言,此次发布代表了企业 AI 工具向成熟迈进的又一步,有效缩小了前沿研究能力与实际业务运营之间的差距。vHC喜好网-记录每日喜好的科技时尚娱乐生活

随着企业从试验阶段迈向生产级 AI 系统,能够简化持续改进模型构建工具的重要性日益凸显。“数据飞轮”概念体现了一种架构模式,即通过不断接触组织内部信息,使 AI 系统始终与业务需求保持一致。vHC喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
比亚迪造出的第一款实车“316”亮相,王传福称第二天就砍掉了

比亚迪造出的第一款实车“316”

11 月

11-19 62阅读
中国大模型要用Infra“降本增效”

中国大模型要用Infra“降本增效

今年7

11-19 58阅读
港式茶餐厅“大退潮”?

港式茶餐厅“大退潮”?

被誉

11-19 53阅读
新茶饮疯狂“24小时”

新茶饮疯狂“24小时”

零售

11-19 62阅读
OpenAI“杀死”在线教育巨头

OpenAI“杀死”在线教育巨头

文章来源:智东西图片来源:由无界AI

11-19 60阅读
《永夜星河》三折叠剧情,怎么「折」都有面儿

《永夜星河》三折叠剧情,怎

作者 / 郑容和编辑 / 朱   婷运营

11-19 58阅读
柯震东吸毒后复出, 出演台湾剧《乩身》网友抵制!

柯震东吸毒后复出, 出演台

柯震东当年凭借着《那些年,我们一

11-19 53阅读
电视剧《三大队》今日开播,秦昊演刑警队长程兵

电视剧《三大队》今日开播

由张译领衔主演,王骁、曹炳琨、魏

11-19 58阅读
扎导又拍新片

扎导又拍新片

扎克·施

11-19 59阅读
大宇资讯恐怖游戏《咒》今日Steam全球同步上市

大宇资讯恐怖游戏《咒》今

恐怖游戏大厂-大宇资讯宣布,改编自台湾

11-19 63阅读
奥特曼格斗进化0怎么放大招?奥特曼格斗进化0攻略

奥特曼格斗进化0怎么放大

《奥特曼格斗进化0》游戏中可以操控各

11-19 100阅读
卧龙苍天陨落全章节龙脉晶石所在位置详细介绍

卧龙苍天陨落全章节龙脉晶

龙脉晶石是卧龙苍天陨落游戏里面的特殊

11-19 62阅读
原神因果命运的花神诞祭主线任务攻略

原神因果命运的花神诞祭主

因果命运的花神诞祭是原神须弥地区主线

11-19 62阅读
原子之心医院区域所有死者位置详细介绍

原子之心医院区域所有死者

在原子之心游戏里面想要达成招魂问卜奖

11-19 69阅读