为“代理式AI”装上“护栏” NVIDIA打造“三重防线” 原创

6个月前 科技 37观看
摘要 从自动化走向智能化,AI正以前所未有的方式释放其潜力,逐步转型为具备解决复杂问题能力的“知识机器人”,为全球数十亿知识工作者描绘了新的图景。然而,这场技术革命的“B面”,隐含的“副作用”愈

从自动化走向智能化,AI正以前所未有的方式释放其潜力,逐步转型为具备解决复杂问题能力的“知识机器人”,为全球数十亿知识工作者描绘了新的图景。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

然而,这场技术革命的“B面”,隐含的“副作用”愈加难以预测。在提升全球生产力的同时,代理式AI所承载的责任和潜在风险正呈指数级增长。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

如何确保这些智能体不偏离道德和规范的轨道,防止其输出有害或不当的结果,是对信任、物理安全、网络安全乃至社会责任感的全面考验。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

当AI的“达摩克利斯之剑”悬于顶上,一场“信任危机”之战正缓缓开启。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

为“代理式AI”装上“护栏”  NVIDIA打造“三重防线”8Ij喜好网-记录每日喜好的科技时尚娱乐生活

NVIDIA 打造“三重防线”铸造AI之“盾”8Ij喜好网-记录每日喜好的科技时尚娱乐生活

面对AI这把双刃剑,我们既要规避其锋芒,也要为其铸造“护盾”。而NVIDIA 正在构筑起应对这场“信任危机”的坚韧“护盾”——NVIDIA NeMo Guardrails。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

NVIDIA NeMo Guardrails微服务并非简单的技术补丁,而是一个开源工具集,作为NVIDIA NeMo的重要组成部分,NVIDIA NeMo Guardrails可以为大语言模型(LLM)应用集成和管理AI护栏,确保AI在预设的安全参数内运行,避免失控和误用。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

NVIDIA NeMo Guardrails的强大之处在于其可扩展性和灵活性。它不仅仅是一套固定的规则,而是一个能够编排多重“AI护栏”的平台,涵盖内容安全、主题控制、PII检测、RAG执行和越狱预防等关键领域。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

借助Colang和LangChain等工具,NVIDIA NeMo Guardrails能够灵活地定义对话流程,并与各种LLM和框架无缝兼容。这种模块化、易于实施的架构,为构建安全、可靠和高度定制化的人工智能应用提供了有力支撑,无论是支持 RAG 的AI代理、智能副驾驶还是聊天机器人,都能从中获益。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

为“代理式AI”装上“护栏”  NVIDIA打造“三重防线”8Ij喜好网-记录每日喜好的科技时尚娱乐生活

截取自:NVIDIA博客8Ij喜好网-记录每日喜好的科技时尚娱乐生活

为了帮助企业在代理式AI在大规模运行时受控,NVIDIA最近宣布在其 NVIDIA NeMo Guardrails平台上新增三项NIM 微服务,这些微服务专门针对 AI 安全和内容审核中的常见挑战,提供一系列实用的解决方案。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

其中,内容安全NIM微服务可以在AI响应之前,对其内容进行审核,检测是否存在潜在的有害信息。这项服务有助于防止AI生成有偏见或有害的输出结果, 确保回答符合道德标准。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

话题控制NIM微服务旨在确保聊天内容保持在预先设定的话题范围内。这意味着,聊天机器人能够更有效地引导用户在特定话题上进行交流,避免偏离原定主题,提高沟通的有效性。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

越狱检测NIM微服务则用于识别和阻止用户尝试绕过AI安全特性的行为,增加对越狱企图的防护, 同时确保在对抗性场景中保持 AI的完整性。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

尤其值得一提的是,内容安全NIM微服务背后,是NVIDIA精心打造的Aegis内容安全数据集。这款人工标注数据集,包含了超过35000个样本,针对AI安全和越狱企图进行了精准标记,为内容安全微服务的训练提供了坚实的基础。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

“这是同类数据集中质量最高的数据源之一。”NVIDIA企业AI模型、软件与服务副总裁Kari Briski这样说。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

面对人工智能的前沿——“代理式AI”的应用。NVIDIA 方面表示,由于“一刀切”的方法无法有效保护和控制复杂的代理式AI工作流, 通过应用多个轻量级专业模型作为护栏, 开发者可以弥补在只采取较为通用的全局策略和保护措施时可能出现的漏洞。开发者可以使用NIM微服务构建更加安全、可信的代理式AI。并部署在汽车、金融、医疗、制造、零售等行业的客户服务中, 提高客户的满意度和信任度。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

值得强调的是,NVIDIA NeMo Guardrails能以最小的延迟提升系统保障能力。实验表明,即使增加到5个护栏,延迟也仅增加约 0.5 秒(从 0.75 秒到 1.25 秒),而合规性却显著提升了50%(从 1X 到 1.5X)。相比之下,仅增加1个护栏就会导致0.25秒的延迟增加(从0.75秒到1秒),合规性仅提升10%。这突显了NeMo Guardrails在保障系统性能的同时,有效提高安全性和合规性的“性价比”。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

然而,仅仅拥有强大的“护盾”还不够,还需要能够发现潜在威胁的“侦察兵”。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

NVIDIA 深谙此道。因此,NVIDIA Research团队开发了开源套件NVIDIA Garak,用于LLM和应用漏洞扫描。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

借助NVIDIA Garak,开发者可以通过评估数据泄露、提示注入、代码幻觉、越狱场景等问题,排查隐藏的漏洞,及时发现并解决使用LLM的系统中所存在的潜在漏洞。通过生成不当或不正确输出结果的测试用例,使开发者更有效地发现并解决AI模型中的潜在弱点,从而提高模型的稳健性与安全性,防患于未然。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

行业巨头“抢装” NVIDIA NeMo Guardrails8Ij喜好网-记录每日喜好的科技时尚娱乐生活

这场“信任危机”的终结之战,并非孤军奋战。众多行业领导者和合作伙伴已经率先行动,通过将NVIDIA NeMo Guardrails 融入到其AI战略中,共同构筑“可信 AI”的未来。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

全球领先的传媒企业软件与服务提供商Amdocs,是先行者之一。目前,Amdocs已经将NVIDIA NeMo Guardrails 集成到 amAIz 平台,以增强该平台的‘可信AI’体验的安全性、可靠性和可扩展性。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

在汽车领域,Cerence AI 选择将 NVIDIA NeMo Guardrails 应用于其车载系统,确保了其CaLLM语言模型能够准确理解情境,有效过滤不当内容,同时为汽车制造商提供定制化的内容安全保障。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

家居装饰零售商巨头劳氏公司(Lowe’s)也将NVIDIA NeMo Guardrails应用于客户服务创新。这一技术的加入显著提升了AI回答的安全性和准确性,让他们能够为客户提供更专业、更可靠的服务支持。持续提升客户服务体验。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

值得注意的是,对于劳氏公司等零售商而言,还可以通过NVIDIA 在NRF展会上宣布推出的建立在NVIDIA AI Enterprise 和 NVIDIA Omniverse平台上的“零售购物助理” AI Blueprint,打造出人工智能驱动的数字助理,提高客户满意度和生产力。目前,该“零售购物助理” AI Blueprint也整合了NeMo Guardrails微服务,旨在为数字购物创造更加可靠、可控的客户交互。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

咨询行业的领军企业Taskus、Tech Mahindra和Wipro也纷纷将NeMo Guardrails集成到其解决方案中,为企业客户提供更加安全、可靠、可控的生成式AI应用。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

事实上,凭借其领先的开放性和可扩展性,NVIDIA NeMo Guardrails构建了一个强大的生态系统,与ActiveFence、Hive、Fiddler、Weights & Biases等领先的AI安全模型、防护提供商和开发工具深度集成,共同应对AI安全领域的各种挑战。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

对于开发者而言,也可以通过 NeMo Guardrails 开源社区,通过编排多项AI软件策略( rail)提高LLM 应用的安全性和可控性。NVIDIA方面称,rail与 NVIDIA NIM微服务一同组成了一个强大的AI系统构建框架,可在不影响安全和性能的情况下进行大规模部署。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

目前,NVIDIA NeMo Guardrails微服务以及用于编排rail 的NVIDIA NeMo Guardrails和NVIDIA Garak套件已向开发者和企业开放。开发者可按照官网的教程使用NVIDIA NeMo Guardrails。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

写在最后8Ij喜好网-记录每日喜好的科技时尚娱乐生活

康德在《纯粹理性批判》强调理性的界限。对比来看,AI作为生产力的新形态,其发展也存在界限,其体现在推动社会进步的“正题”和潜在风险的“反题”之间。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

NVIDIA NeMo Guardrails正为AI勾勒出运行的边界,让AI即可以最大限度地发挥其能动性,同时不会逾越伦理与安全的红线。同时,NVIDIA通过构建“三重防线”,帮助行业更好驾驭AI,在保障安全的前提下最大程度释放AI的潜力和价值。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

如今的AI,正在逐渐在自由与约束之间找到平衡点。8Ij喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
OPPO Reno13系列外观详解:蝴蝶紫配色惊艳 超美小OPhone

OPPO Reno13系列外观详解:蝴蝶紫

在结束了

11-19 120阅读
SVM频闪指标低的旗舰!iQOO Neo10系列屏幕参数出炉

SVM频闪指标低的旗舰!iQOO Neo10

11月18日

11-19 117阅读
轻云鲸裕完成数千万元的Pre-A轮融资

轻云鲸裕完成数千万元的Pre-A轮

近期,

11-19 117阅读
哪个正常人能拒绝一只毛茸茸的「电子猫咪」?

哪个正常人能拒绝一只毛茸茸的「

猫咪

11-19 131阅读
这个东北小镇,拿捏年轻人的第一件貂

这个东北小镇,拿捏年轻人的第一件

你会

11-19 130阅读
ENHYPEN的第二张正规专辑后续《ROMANCE:UNTOLD-daydream-》刷新了历代K-POP后续专辑中创下了最高初动销量新纪录

ENHYPEN的第二张正规专辑

18日,据Hanteo Chart榜单数

11-19 104阅读
2024花田音乐节燃爆金乡卫城,重磅阵容嗨唱两天狂欢不停

2024花田音乐节燃爆金乡卫

  11月23至24日,金乡卫城·花

11-19 113阅读
20岁大学生开车26天去上学引百万人围观:从中国南京开到英国杜伦

20岁大学生开车26天去上学

“我真的做到了!

11-19 117阅读
最美《变形金刚》女主梅根福克斯怀孕登热搜 网友谈样貌:咋成卡戴珊了...

最美《变形金刚》女主梅根

11月12日消息,知

11-19 107阅读
肖战演郭靖!新《射雕》能复兴徐克的武侠梦吗 网友:肩负文化出海重任

肖战演郭靖!新《射雕》能复

11月18日消息,由

11-19 105阅读
与柴犬开启治愈探险之旅!异世界动作冒险新游《妖怪之国》登陆Steam

与柴犬开启治愈探险之旅!异

在这个繁忙喧嚣的现代社会,我们时常渴

11-19 122阅读
《战神:诸神黄昏》6.001补丁发布 优化手柄和显卡支持

《战神:诸神黄昏》6.001补

《战神:诸神黄昏》6.001更新版本着重解

11-19 114阅读
三国群英传7秘籍大全_三国群英传7所有秘籍代码一览

三国群英传7秘籍大全_三国

三国群英传7游戏支持秘籍功能,玩家可以

11-19 145阅读
城市天际线秘籍代码及使用方法详细介绍

城市天际线秘籍代码及使用

《城市:天际线》是以建造和管理城市为题

11-19 108阅读
饥荒宠物洞召唤宠物所需物品一览

饥荒宠物洞召唤宠物所需物

宠物洞是饥荒游戏里面的一个特殊场景,在

11-19 130阅读