DeepSeek狂飙,别让安全隐患成为“定时炸弹” 原创

5个月前 科技 33观看
摘要 幻觉一直是大模型输出的最大“天敌”,幻觉也就是我们常说的一本正经地“胡说八道”,生成内容不遵循原文或者不符合事实。无论多先进的模型,都无法完全避免这一问题。Vectara HHEMAI幻觉排行榜最

幻觉一直是大模型输出的最大“天敌”,幻觉也就是我们常说的一本正经地“胡说八道”,生成内容不遵循原文或者不符合事实。无论多先进的模型,都无法完全避免这一问题。Vectara HHEMAI幻觉排行榜最新数据显示,DeepSeek-V3幻觉率为3.9%,受到各界热捧的DeepSeek-R1则为14.3%。eR6喜好网-记录每日喜好的科技时尚娱乐生活

尽管如此,也不影响这个最先进的模型在企业中的部署速度,几乎一夜之间,云、硬件、软件厂商迅速接入DeepSeek,亚马逊云科技也是第一批宣布接入DeepSeek的云厂商之一,目前在Amazon Bedrock和Amazon SageMaker AI中提供了4种部署DeepSeek-R1系列模型的方式。然而,企业在快速接入模型时,很可能没有考虑其会造成的潜在安全风险,尤其是敏感信息防护、负责任的AI和合规等一系列问题。eR6喜好网-记录每日喜好的科技时尚娱乐生活

亚马逊云科技深知AI安全的重要性,并为其安全防护做足了准备。因为安全一直是亚马逊云科技的第一要务。2024年亚马逊云科技re:Invent上,亚马逊云科技CEO Matt Garman再次重申:“安全性必须是构建业务的根基!”亚马逊云科技提供了安全防护三部曲,涵盖基础的安全防护,有害内容的过滤防护,以及稳健的深度防御策略,为企业AI创新保驾护航。eR6喜好网-记录每日喜好的科技时尚娱乐生活

构筑AI安全基石:基础安全防护eR6喜好网-记录每日喜好的科技时尚娱乐生活

自2023年4月亚马逊云科技推出Amazon Bedrock以来,经过持续更新与优化,它已成为企业构建和扩展生成式AI应用最简单的方法。目前Amazon Bedrock提供了全面的安全功能,帮助保障开源和开放权重模型的托管与运营安全,同时确保数据隐私和合规性。主要功能包括静态数据和传输中数据加密、细粒度访问控制、安全连接选项以及各种合规认证。eR6喜好网-记录每日喜好的科技时尚娱乐生活

亚马逊云科技人工智能和数据副总裁Swami Sivasubramanian博士表示,Amazon Bedrock拥有广泛的模型选择、领先的功能,使开发人员能够更轻松地将生成式AI集成到其应用中,并且注重安全和隐私。eR6喜好网-记录每日喜好的科技时尚娱乐生活

亚马逊云科技通过全面的全平台安全和合规措施进一步增强了这些功能,例如:通过Amazon KMS密钥管理服务对静态数据和传输中数据进行加密;通过Amazon IAM进行身份与访问管理;通过部署Amazon VPC虚拟私有云、VPC终端节点以及用于传输层安全(TLS)检查和严格策略规则的Amazon Network Firewall网络防火墙服务来实现网络安全;提供针对亚马逊云科技账户层面治理的服务控制策略;使用用于访问限制的安全组和网络访问控制列表(NACL);提供包括HIPAA、ISO、GDPR在内的国际主流合规认证;通过Amazon CloudWatch和Amazon CloudTrail进行监控和日志记录等。eR6喜好网-记录每日喜好的科技时尚娱乐生活

亚马逊云科技还会对所有模型容器进行漏洞扫描,并且仅接受 Safetensors格式的模型,以帮助防止不安全的代码执行。eR6喜好网-记录每日喜好的科技时尚娱乐生活

防止AI幻觉:有害信息处理eR6喜好网-记录每日喜好的科技时尚娱乐生活

此前亚马逊云科技就推出了Amazon Bedrock的安全防护栏Guardrails功能,帮助企业轻松实施生成式AI应用程序的保护措施,并根据自身需求和负责任AI政策进行定制。eR6喜好网-记录每日喜好的科技时尚娱乐生活

Guardrails功能提供的多重保障包括:过滤不良内容、删除个人身份信息(PII)以及提升内容的安全性和隐私性。用户可以根据具体使用场景和负责任的 Al 策略,配置多样的安全策略,包括禁止回复话题、内容过滤、词语过滤器、PII(个人敏感信息)删除、上下文验证的准确性检查以及根据预定回复策略文档的自动推理检查。eR6喜好网-记录每日喜好的科技时尚娱乐生活

Guardrails功能主要有两种使用方式,第一,它可以直接与调用模型式(InvokeModel)或对话式(Converse)API集成,在推理过程中,防护机制会应用于输入提示和模型输出。第二,可以通过ApplyGuardrail API调用,允许在不调用模型的情况下直接评估内容,适用于在应用程序各个阶段评估输入或输出,尤其对处理自定义模型或第三方模型非常有用。eR6喜好网-记录每日喜好的科技时尚娱乐生活

2024年亚马逊云科技re:Invent,Amazon Bedrock Guardrails还推出了防止幻觉的自动推理检查功能,可以让Amazon Bedrock验证事实响应的准确性,生成可审计的输出,并向客户清晰展示模型得出结果的原因。这提升了透明度,确保模型响应符合客户的规则和政策。eR6喜好网-记录每日喜好的科技时尚娱乐生活

例如用户可以通过Amazon Bedrock的自定义模型导入功能导入DeepSeek-R1蒸馏模型,并为其创建一套包含多种过滤策略的安全护栏。对于通过Amazon Bedrock和Amazon SageMaker导入的开放权重蒸馏模型,亚马逊云科技建议设置以下关键过滤器:提示词攻击防护、内容审查、主题限制和敏感信息保护。eR6喜好网-记录每日喜好的科技时尚娱乐生活

“以前大模型缺乏可证明事实的逻辑,导致出现幻觉时难以纠正。”亚马逊云科技大中华区产品部总经理陈晓建说,有了自动推理技术,我们能够通过数学验证方式严密证明事实性错误是否会发生,从而有效改善幻觉问题。eR6喜好网-记录每日喜好的科技时尚娱乐生活

完整的深度防御策略:AI安全的全栈屏障eR6喜好网-记录每日喜好的科技时尚娱乐生活

针对生成式AI带来的安全挑战,企业需要构建一套完整的深度防御策略,包括韧性的企业架构、全生命周期的安全设计、安全的云基础架构、经典的分层防御策略以及信任边界控制等多个方面。eR6喜好网-记录每日喜好的科技时尚娱乐生活

企业可以在架构中部署分层的亚马逊云科技安全服务,在保障云环境的同时,保护生成式AI工作负载的安全。同时企业还可以利用Amazon SageMaker和Amazon Bedrock等AI/ML服务中提供的增强型安全和隐私功能,为AI应用增加更多层面的强化安全和隐私控制。eR6喜好网-记录每日喜好的科技时尚娱乐生活

在生成式AI时代,企业需要更加关注安全问题,从开始就要对DeepSeek等模型实施安全防护。通过基础防护、有害信息处理和深度防御三重策略,降低提示注入攻击、内容滥用等风险,确保AI应用符合道德和监管要求。eR6喜好网-记录每日喜好的科技时尚娱乐生活

在AI安全环境快速演变的背景下,企业同时需定期审查和更新防护机制,持续优化安全控制,以应对新兴威胁。可以肯定的是,Amazon Bedrock结合云安全服务和最佳实践,提供了一致的安全框架,保护企业当前及未来的开放权重模型。只有将安全置于首位,企业才能在保障合规与稳定的基础上,高效推动AI创新与落地,实现技术价值的最大化。eR6喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
今年双11大变样,淘宝京东不卷了!

今年双11大变样,淘宝京东不卷了!

在被电商平台造出的第16个年头,双

11-19 110阅读
比亚迪成全球首家达成第1000万辆新能源汽车下线车企

比亚迪成全球首家达成第1000万辆

11月1

11-19 127阅读
小鹏汇天“陆地航母”2024 广州车展完成全球公开载人首飞

小鹏汇天“陆地航母”2024 广州

11-19 116阅读
慢热的腾讯,上火的AI搜索

慢热的腾讯,上火的AI搜索

11月1

11-19 120阅读
又一百亿独角兽申请破产了

又一百亿独角兽申请破产了

近日,

11-19 147阅读
让赵露思摇来肖战鹿晗打call的《珠帘玉幕》,好看不?|Talk剧评

让赵露思摇来肖战鹿晗打ca

作者 / 张   特编辑 / 阿   笔运

11-19 128阅读
于谦因釜山行爆红, 啥梗真没想到讲相声的他竟出演过这么多作品

于谦因釜山行爆红, 啥梗真

于谦明明就是一个讲相声的人,怎么

11-19 117阅读
百部青少年教育公益微电影《星光好少年之少年王维》开机仪式在北京顺利举行

百部青少年教育公益微电影

  2024年11月9日,由泰安东升公益慈

11-19 104阅读
《我的主场》“篮”大凌晨五点魔鬼拉练 宏远主场喜提冠军大师课

《我的主场》“篮”大凌晨

  如果用运动定义青春,那么篮球必定

11-19 122阅读
我们都在等待,等待钟声响起的那一刻。那是我生命最后的一刻,那也是最好的时刻

我们都在等待,等待钟声响起

  一段民族不可遗忘的历史,一个隐蔽

11-19 108阅读
非线性悬疑侦探新作《心灵警探》现已登陆PC、PS5和Switch

非线性悬疑侦探新作《心灵

2024年11月15日,法国·蒙彼利埃 – 发行

11-19 142阅读
保卫萝卜4太空穿越4关通关攻略

保卫萝卜4太空穿越4关通关

保卫萝卜4是最新发布的游戏,相信喜欢保

11-19 132阅读
碧蓝航线ios反和谐教程_碧蓝航线ios反和谐2024

碧蓝航线ios反和谐教程_碧

碧蓝航线ios反和谐怎么弄?相信很多苹果

11-19 147阅读
小小突击队礼包码,小小突击队周年礼包码2023.9

小小突击队礼包码,小小突击

小小突击队礼包码来啦!这次为大家带来的

11-19 108阅读
饥荒超详细驯服牦牛技巧分享

饥荒超详细驯服牦牛技巧分

在饥荒游戏里面玩家可以驯服牦牛,而且根

11-19 117阅读