Nvidia 发布 NeMo 微服务 助力简化 AI 代理开发

3个月前 科技 18观看
摘要 Nvidia 宣布其 NeMo 微服务现已全面发布,为企业提供工具,以构建能够与业务系统集成且通过数据交互持续改进的 AI 代理。此项微服务的推出正值各组织迫切寻求能够为重大科技投资带来可量化回报

Nvidia 宣布其 NeMo 微服务现已全面发布,为企业提供工具,以构建能够与业务系统集成且通过数据交互持续改进的 AI 代理。此项微服务的推出正值各组织迫切寻求能够为重大科技投资带来可量化回报的具体 AI 实施策略之时。gkY喜好网-记录每日喜好的科技时尚娱乐生活

企业 AI 面临数据整合挑战 企业在采用 AI 技术时面临一大关键挑战:构建能够通过不断学习业务数据来保持准确性与实用性的系统。NeMo 微服务通过打造 Nvidia 所描述的 “数据飞轮” (data flywheel)来应对这一挑战,使 AI 系统能够通过持续接触企业信息及用户交互保持相关性。gkY喜好网-记录每日喜好的科技时尚娱乐生活

该全新工具包包含五项核心微服务:gkY喜好网-记录每日喜好的科技时尚娱乐生活

NeMo Customizer 负责对大语言模型进行微调,以实现更高的训练吞吐量。gkY喜好网-记录每日喜好的科技时尚娱乐生活

NeMo Evaluator 提供针对定制基准的简化 AI 模型评估。gkY喜好网-记录每日喜好的科技时尚娱乐生活

NeMo Guardrails 实施安全控制,确保合规并输出适当的响应。gkY喜好网-记录每日喜好的科技时尚娱乐生活

NeMo Retriever 实现跨企业系统的信息访问。gkY喜好网-记录每日喜好的科技时尚娱乐生活

NeMo Curator 处理与整理用于模型训练及改进的数据。gkY喜好网-记录每日喜好的科技时尚娱乐生活

这些组件协同工作,打造出能够作为数字同事独立执行任务、仅需极少人工监管的 AI 代理。与传统的聊天机器人不同,这些代理能够自主采取行动并基于企业数据做出决策,它们可连接现有系统,以访问信息存储在组织内部的最新数据。gkY喜好网-记录每日喜好的科技时尚娱乐生活

技术架构支持持续改进 NeMo 与 Nvidia 推理微服务(命名为 NIMs)之间的区别在于其互补功能。正如 Nvidia 企业级生成式 AI 软件部高级总监 Joey Conway 所言,“NIMs 用于推理部署——运行模型、问题输入、答复输出,而 NeMo 则专注于如何改进该模型:数据准备、训练技术、评估。”当 NeMo 完成了模型的优化后,可通过 NIM 部署到生产环境中。gkY喜好网-记录每日喜好的科技时尚娱乐生活

早期实践已展示了显著的商业效果。电信软件供应商 Amdocs 利用 NeMo 微服务开发了三个专用代理;AT&T 与 Arize 及 Quantiphi 合作,构建了一个每周更新近 10,000 份文档的代理;而 Cisco 的 Outshift 部门与 Galileo 合作,创建了一款响应速度快于同类工具的编程助手。gkY喜好网-记录每日喜好的科技时尚娱乐生活

这些微服务以 Docker 容器形式运行,并通过 Kubernetes 进行编排,从而实现可在多种计算环境中的部署。它们支持包括 Meta 的 Llama、Microsoft 的 Phi 系列、Google 的 Gemma 及 Mistral 在内的多种 AI 模型,Nvidia 自家的侧重推理能力的 Llama Nemotron Ultra 亦与该系统兼容。gkY喜好网-记录每日喜好的科技时尚娱乐生活

这一发布进入了一个竞争激烈的市场,企业在 AI 开发选择上众多,包括 Amazon 的 Bedrock、Microsoft 的 Azure AI Foundry、Google 的 Vertex AI、Mistral AI、Cohere 以及 Meta 的 Llama 技术栈。Nvidia 则通过与自身硬件生态系统的深度整合以及通过 AI Enterprise 软件平台提供的企业级支持,在众多方案中脱颖而出。gkY喜好网-记录每日喜好的科技时尚娱乐生活

Nvidia NeMo 与企业 AI 采纳 对于技术团队而言,这些微服务提供了降低实施复杂性的基础设施。容器化方法使得在内部部署或云环境中都能利用企业级的安全性及稳定性特性。这种灵活性有效应对了 AI 实施过程中经常碰到的数据主权与监管合规性问题。gkY喜好网-记录每日喜好的科技时尚娱乐生活

在评估这些工具时,组织应考虑现有 GPU 基础设施投资、数据治理需求以及与现有系统的整合需求。对于在业务数据不断变化中仍能保持准确性的 AI 代理的需求,将推动支持持续学习周期的平台的广泛应用。gkY喜好网-记录每日喜好的科技时尚娱乐生活

这种微服务方法反映了整个行业向模块化 AI 系统转变的趋势,这类系统能够为特定业务领域量身定制,而无需重构基础组件。对技术决策者而言,此次发布代表了企业 AI 工具向成熟迈进的又一步,有效缩小了前沿研究能力与实际业务运营之间的差距。gkY喜好网-记录每日喜好的科技时尚娱乐生活

随着企业从试验阶段迈向生产级 AI 系统,能够简化持续改进模型构建工具的重要性日益凸显。“数据飞轮”概念体现了一种架构模式,即通过不断接触组织内部信息,使 AI 系统始终与业务需求保持一致。gkY喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
抖音电商拐点已至,从美妆行业开始跌落?

抖音电商拐点已至,从美妆行业开始

前几日,抖音首次公布了“双11”大

11-19 116阅读
Redmi史上强旗舰!K80系列开启预约:下周发布

Redmi史上强旗舰!K80系列开启预约

11月19日

11-19 113阅读
大佬喊话,AI寒冬已来?

大佬喊话,AI寒冬已来?

OpenA

11-19 107阅读
灵初智能完成天使轮融资

灵初智能完成天使轮融资

近日,

11-19 116阅读
山东新起点完成2000万元A轮融资

山东新起点完成2000万元A轮融资

近日,

11-19 130阅读
抖音短剧《大话·大话西游》开播 33位喜剧人出演

抖音短剧《大话·大话西游

11月8日消息,据抖音集团官方公众号透露,

11-19 106阅读
陶喆深夜送美女回家, 疑似再次出轨遭经纪人否认!

陶喆深夜送美女回家, 疑似

陶喆也算是家喻户晓的歌星了,曾经

11-19 119阅读
泰妍将在今天(18日)下午6点发布迷你六辑《Letter To Myself》

泰妍将在今天(18日)下午6

凭借《To. X》创造热潮的少

11-19 101阅读
张晚意新剧《我知道我爱你》今日开播,他化身宠物医生

张晚意新剧《我知道我爱你

12月25日,张晚意的新剧《我知道我

11-19 124阅读
2024东方卫视跨年首发阵容,胡歌唐嫣代表《繁花》剧组亮相

2024东方卫视跨年首发阵容

12月25日,2024东方卫视跨年首发阵

11-19 103阅读
《优米雅的鍊金工房》第二波情报,新宣传片公开

《优米雅的鍊金工房》第二

活着, 就会不断地累积记忆。这是她在灭

11-19 108阅读
索尼正在开发自动检测游戏BUG的AI系统:简化测试流程

索尼正在开发自动检测游戏

根据 Tech4Gamer 报道,根据索尼目前发

11-19 111阅读
《战神:诸神黄昏》6.001补丁发布 优化手柄和显卡支持

《战神:诸神黄昏》6.001补

《战神:诸神黄昏》6.001更新版本着重解

11-19 113阅读
TGA:DLC、拓展包、新赛季、重制版等均可提名所有奖项

TGA:DLC、拓展包、新赛季、

今日(11月16日),TGA主创Geoff Keighley与

11-19 119阅读
原子之心巴浦洛夫综合体区域死者位置分享

原子之心巴浦洛夫综合体区

原子之心游戏中的巴浦洛夫综合体区域里

11-19 109阅读