如果竞争对手推出“高风险” AI,OpenAI可能调整其安全措施

4个月前 科技 25观看
摘要 在更新 Preparedness Framework ( OpenAI 用于决定 AI 模型是否安全以及在开发和发布过程中需要采取何种安全措施的内部框架)时,OpenAI 表示,如果竞争对手的 AI 实验室推出没有相应安全措施的“

在更新 Preparedness Framework ( OpenAI 用于决定 AI 模型是否安全以及在开发和发布过程中需要采取何种安全措施的内部框架)时,OpenAI 表示,如果竞争对手的 AI 实验室推出没有相应安全措施的“高风险”系统,其可能会“调整”自身的安全要求。vvr喜好网-记录每日喜好的科技时尚娱乐生活

这一变化反映了商业 AI 开发者在竞争压力日益加剧的环境下,加速部署模型的趋势。OpenAI 曾被指责为为了更快推出产品而降低安全标准,并未能及时提供详细说明其安全测试的报告。上周,有 12 位前 OpenAI 员工在 Elon Musk 针对 OpenAI 提起的诉讼中提交了一份简报,主张如果 OpenAI 完成其计划中的公司重组,该公司可能会因此进一步削减安全措施的要求。vvr喜好网-记录每日喜好的科技时尚娱乐生活

或许早有预料,OpenAI 声称不会轻易做出这些政策调整,并且会将其安全措施保持在“更高保护水平”。vvr喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 在周二下午发布的一篇博客文章中写道:“如果另一家前沿 AI 开发者推出了没有相应安全措施的高风险系统,我们可能会调整我们的要求。然而,我们首先会严格确认风险形势确实发生了变化,公开承认我们正在做出调整,对该调整评估是否不会显著增加整体的严重伤害风险,并且仍将安全措施保持在更高的保护水平。”vvr喜好网-记录每日喜好的科技时尚娱乐生活

更新后的 Preparedness Framework 同时明确表示,OpenAI 正在更大程度上依赖自动化评估来加速产品开发。公司表示,虽然并未完全放弃由人工主导的测试,但已构建出“一系列不断扩展的自动化评估工具”,据称这些工具可以“跟上更快的发布节奏”。vvr喜好网-记录每日喜好的科技时尚娱乐生活

一些报道对此提出了异议。据《金融时报》报道,OpenAI 为即将推出的一款重大全新模型的安全检查给予测试人员不足一周的时间——相比之前的版本时间更为紧张。该刊物的消息来源还称,OpenAI 的许多安全测试现在是在公开发布版本之前的早期模型上进行的。vvr喜好网-记录每日喜好的科技时尚娱乐生活

对于 OpenAI 是否在安全问题上做出妥协的说法,该公司在声明中进行了驳斥。vvr喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 正悄然降低其安全承诺。 —— Steven Adler (@sjgadler) 2025 年 4 月 15 日vvr喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI Framework 的其他变更涉及到公司如何根据风险对模型进行分类,包括那些能够隐藏其能力、逃避安全措施、阻止系统关闭甚至实现自我复制的模型。OpenAI 表示,现在将重点关注模型是否达到以下两个阈值之一:“高”能力或“关键”能力。vvr喜好网-记录每日喜好的科技时尚娱乐生活

根据 OpenAI 的定义,前者指的是能够“放大现有导致严重伤害途径”的模型;后者则指那些“引入前所未有、导致严重伤害的新途径”的模型。vvr喜好网-记录每日喜好的科技时尚娱乐生活

OpenAI 在其博客文章中写道:“达到高能力标准的系统在部署前必须具备能够充分最小化相关严重伤害风险的安全措施;达到关键能力标准的系统在开发过程中也需要具备能够充分最小化相关风险的安全措施。”vvr喜好网-记录每日喜好的科技时尚娱乐生活

这是 OpenAI 自 2023 年以来首次对 Preparedness Framework 进行更新。vvr喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
疑遭猎杀 泰海域发现无头“美人鱼”:只因毫无科学依据的传说

疑遭猎杀 泰海域发现无头“美人

11月19日

11-19 125阅读
研究人员开发自动识别古代楔形文字片的AI软件

研究人员开发自动识别古代楔形文

11月2

11-19 127阅读
映泰推出 MT-N97 工业计算机:无风扇设计,配英特尔 N97 处理器

映泰推出 MT-N97 工业计算机:无风

11 月

11-19 103阅读
‌上汽奥迪首款B级车型将明年年中发布‌

‌上汽奥迪首款B级车型将明年年

11-19 120阅读
李子柒归来,牵扯许多人情世故?

李子柒归来,牵扯许多人情世故?

“这

11-19 102阅读
NCT DREAM正辑四辑《DREAMSCAPE》登上韩国国内各大专辑周榜一位

NCT DREAM正辑四辑《DREAM

11月11日发行的NCT DREAM正辑

11-19 106阅读
《山水间的家》:围屋承古韵,老区展新颜!

《山水间的家》:围屋承古韵

  从赣南大地到沂蒙山区,乡土文化在

11-19 106阅读
山东卫视《中华家庭诗词擂台赛》 共品大宋“战狼”辛弃疾的峥嵘岁月

山东卫视《中华家庭诗词擂

  “品诗词之美,传诗礼家风”,由山东

11-19 108阅读
余顺《不越雷池》 尘世清浊,做个正人只能不怕难 黄梅戏(余顺不越雷池尘世清浊)

余顺《不越雷池》 尘世清

戏剧|DRAMA 昨晚在国家大剧

11-19 107阅读
微念称与李子柒的案件已完全和解:账号其本人运营 品牌由微念经营

微念称与李子柒的案件已完

11月13日消息,日

11-19 125阅读
元气骑士前传兑换码2024_元气骑士前传新手礼包码

元气骑士前传兑换码2024_

最近元气骑士前传这款游戏十分火爆,那么

11-19 107阅读
卧龙苍天陨落怎么提升武将好感度?提升武将好感度的方法分享

卧龙苍天陨落怎么提升武将

卧龙苍天陨落怎么提升武将好感度?在卧龙

11-19 107阅读
原子之心前期速刷神经聚合物的方法分享

原子之心前期速刷神经聚合

神经聚合物是原子之心游戏中用来解锁技

11-19 104阅读
原神疗养观察任务流程|原神疗养观察攻略

原神疗养观察任务流程|原

原神疗养观察是游戏中须弥地区魔神任务

11-19 104阅读
原神训练有素的考古学家隐藏成就任务攻略

原神训练有素的考古学家隐

训练有素的考古学家是须弥沙漠地区的隐

11-19 112阅读