FICO 首席分析官 Scott Zoldi:创新助力 AI 的落地

2周前 科技 4观看
摘要 FICO 首席分析官 Scott Zoldi 在过去 25 年中一直在 HNC 和 FICO(现已合并)任职,领导 HNC FICO 的分析与 AI 项目。FICO 在消费者领域以信用评分著称,而 FICO 平台则帮助企业更好地了解客户,以提

FICO 首席分析官 Scott Zoldi 在过去 25 年中一直在 HNC 和 FICO(现已合并)任职,领导 HNC FICO 的分析与 AI 项目。FICO 在消费者领域以信用评分著称,而 FICO 平台则帮助企业更好地了解客户,以提供超个性化的客户体验。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“从 FICO 的角度来看,我们需要确保持续以负责任的方式发展 AI,” Zoldi 说。“如今关于生成式 AI 的讨论非常热烈,我们的关注点在于如何有效将其落地,从而在部署真正能解决业务问题的技术的同时,实现所谓 ‘AI 黄金时代’ 的构想。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

虽然当今的 AI 平台通过简化模型治理和提高部署效率,同时提供更强的模型开发控制,但各组织仍需针对具体使用场景选择最适合的 AI 技术。NV0喜好网-记录每日喜好的科技时尚娱乐生活

Zoldi 表示,许多模型产生幻觉和不道德行为的原因都源自构建模型所用的数据。“我看到许多公司,包括 FICO,自行构建针对特定领域问题的数据集,以便用生成式 AI 进行解决。我们也在构建自己的基础模型,而这几乎已是所有组织都能掌握的能力。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

他认为,最大的挑战是无法完全消除幻觉。“我们需要的基本上是一种基于风险的方法,规定谁可以使用这些输出、何时使用,可能还需要一个辅助分数,比如 AI 风险分数或 AI 信任分数,用以判断该回答是否与构建时所依据的数据一致,从而表明该 AI 很可能没有产生幻觉。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

构建自主模型的原因包括对模型构建过程拥有完全掌控,以及基于数据质量降低偏见和幻觉的概率。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“当你构建一个模型并得到输出时,这可能是幻觉也可能不是。除非你知道答案,否则你无法判断,这正是问题所在。我们在生成语言模型的同时,也会生成 AI 信任分数,因为它们基于相同的数据构建。” Zoldi 说。“(信任分算法)理解大语言模型应当完成的任务,理解模型所训练的知识锚点——也就是构建该模型时依据的知识库——因此,当用户提出问题时,系统会查看提示、响应,并给出一个信任分数,表明模型的回答与其构建依据的知识锚点相符的程度。基本上这是一种基于风险的方法。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

FICO 花了不少时间思考如何更好地整合小型或专注领域的语言模型,而不是简单地通过 API 连接通用生成式 AI 模型。这些“较小”的模型的参数可能只有 80 到 100 亿,而相比之下,通用模型可能有 200 亿甚至超过 1000 亿的参数。NV0喜好网-记录每日喜好的科技时尚娱乐生活

他补充道,你可以用较小的语言模型达到与大语言模型相同的效果,因为可以允许小型语言模型花更多时间去推理答案。“这很有意义,因为这意味着那些仅能承担较小硬件投资的组织,也能构建一个小型模型,并以较低成本部署,从而在模型开发和实际生产推理费用上都比大语言模型更具优势。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

该公司还在使用智能代理 AI。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“智能代理 AI 并不是新鲜事,但我们现在已有分配决策权给独立 AI 操作员的框架。我对智能代理 AI 持开放态度,因为你可以把复杂问题分解成更简单的问题,而这些简单的问题只需更简单的模型解决。” Zoldi 说。“下一个方向是将智能代理 AI 与大语言模型相结合,不过对于我们大多数客户来说,构建小型语言模型并以安全方式解决问题可能是最迫切的。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

目前,FICO 主要在以下场景中使用智能代理 AI:生成合成数据,以帮助抵御并预防攻击者日益演进的手法。同时,FICO 正在构建专注于处理金融欺诈与诈骗、信用风险、信贷发放、催收、行为评分以及优化客户旅程的语言模型。事实上,Zoldi 最近仅用了一块小型 GPU 在 31 天内就创建了一个专注模型。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“我想我们都曾看到头条报道,谈论那些拥有数十亿参数和数千块 GPU 的庞大模型,但实际上单块 GPU 也可以走得很远,” Zoldi 说。NV0喜好网-记录每日喜好的科技时尚娱乐生活

Zoldi 眼中的 2025 年挑战NV0喜好网-记录每日喜好的科技时尚娱乐生活

CIO 面临的最大挑战之一便是预见美国监管环境的不断变化。然而,Zoldi 相信监管与创新是相辅相成的。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“我坚信监管和创新是相互激励的,但其他人却在思考如何在监管不具约束性的情况下适当开发 AI 应用,” Zoldi 说。“如果监管没有明确告诉你如何合规,那么你就只能猜测监管可能如何变化以及如何应对。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

很多组织认为监管是创新的障碍,而不是创新的灵感源泉。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“真正的创新是一种挑战声明,比如 ‘这种创新需要具备怎样的特征?’ 以便我能达到业务目标,获得预测,同时拥有可解释的模型和符合道德标准的 AI。这意味着需要更好的模型,” Zoldi 说。“有人认为不应该有任何限制,但如果没有这些限制,人们将不断索求更多数据,忽视版权问题。你也可能走上深度学习的道路,结果得到的是不可解释的、不透明、甚至常常不道德的模型。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

FICO 的创新实践NV0喜好网-记录每日喜好的科技时尚娱乐生活

在 FICO,创新与落地是同一回事。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“我们去年刚刚构建了第一个专注模型。我们已经证明,在处理特定领域问题时,小模型的表现与市面上的大型语言模型并无二致,然后我们将其落地。” Zoldi 说。“这意味着我正在设计最有效的方式,把 AI 嵌入到我的软件中。我们正在 FICO 平台上寻找独特的软件设计,以高效执行这些技术。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

不久前,Zoldi 及其团队希望为 FICO 平台增加审计能力。为此,他们采用了 AI 区块链技术。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“AI 区块链记录了模型开发的过程、需要监控的内容以及何时撤回模型。这些都是在落地过程中从创新角度必须融入的重要概念,因此创新的一个大部分就在于如何将这些技术落地。它涉及到合理利用生成式 AI,解决我们业务中特定领域最需要解决的问题。我们也在尝试智能代理 AI以及其他概念,以确定未来是否有更吸引我们的方向。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

FICO 建立的审计能力能够追踪平台上每一项决策,记录哪些决策或配置发生了改变、为何改变、何时改变以及由谁改变。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“这涉及到软件及其组件、策略如何变化以及模型如何运作。关键之一在于确保在 AI 或机器学习模型部署到平台时,所有步骤均被审计,并对操作过程进行监控,从而能够明确知道是谁在更改模型或策略,谁做出了决策,该决策是否在部署前经过测试,以及支持该解决方案的数据依据。对我们来说,这样的验证应保留在区块链上,以确保对这些配置有不可更改的记录。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

FICO 在开发和运行模型时均采用 AI 区块链,记录下每个决策。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“可观测性(Observability)在当今的 AI 平台中是个重要概念。当我们开发模型时,会使用区块链记录开发过程,以满足治理和监管要求。在同一条区块链上,还记录了实时监控 AI 模型所需的信息;如果缺少可观测性作为软件核心概念,这一切都将无从实现,” Zoldi 说。“落地中的创新实际上源自于组织部署决策解决方案的软件与云计算技术不断进步,因此我们 25 年、20 年或 10 年前的做法,如今已不是最高效的方式。这也改变了我们必须如何去落地、部署乃至审视数据等基本问题。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

为何 Zoldi 拥有自己专门的软件开发团队NV0喜好网-记录每日喜好的科技时尚娱乐生活

大多数软件开发组织归 CIO 或 CTO 管理,在 FICO 亦是如此,不过 Zoldi 自己也拥有专门的软件开发团队,并与 FICO 的 CTO 密切合作。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“如果 FICO 的创新需要落地,就必须有对近期部署方式的清晰规划。我们的软件开发团队确保我们能设计出合适的软件架构,以满足所需的吞吐量和延迟要求,” Zoldi 说。“我们的 CTO Bill Waid 和我都非常关注新型软件设计,确保所有价值都能落地实现。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

一个专门的软件团队已归 Zoldi 管理近 17 年,其中一个好处是使他可以自主探索如何将创新落地,从而向 CTO 及平台团队提出建议,确保新思路能以负责任的方式落地。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“如果我想采用一个专注语言模型,并找出部署和推理的最高效途径,我就不会依赖于其他团队。这使我能够快速创新,因为我团队开发的所有内容都需要落地并可以部署。这样,我不仅带来了有趣的算法和商业案例,还带来了一整套软件,使我可以明确地告诉大家其运行参数。这保证了我基本上能优先调动软件人才来解决我在 AI 解决方案中的问题。这一点非常重要,因为我可能要规划三年、四年甚至五年后的需求。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

另一个好处则是,CTO 和更大的软件组织无需都是 AI 专家。NV0喜好网-记录每日喜好的科技时尚娱乐生活

“我认为像我所领导的高性能 AI 机器学习研究团队,确实需要拥有软件组件的控制权,而不至于陷入获得软件支持的排队中。除非相关人员专门从事 AI、机器学习和 MLOps,否则体验会相当糟糕。这就是 FICO 采取这种方法以及分工明确的原因。”NV0喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
戴森设计大奖国际20强名单出炉

戴森设计大奖国际20强名单出炉

【锋巢网】首次有两支中国大陆赛

11-19 64阅读
明星为何争做探店顶流?

明星为何争做探店顶流?

采写/陈纪英编辑/万天南明星的尽头

11-19 64阅读
小米手机快速占领高端:4000-6000元份额大涨

小米手机快速占领高端:4000-6000

11月18日

11-19 65阅读
灵宝 CASBOT 01 人形机器人发布:52自由度,头部配屏,获联想投资

灵宝 CASBOT 01 人形机器人发布:5

11-19 59阅读
大模型的效率腾飞,彩云科技做对了什么?

大模型的效率腾飞,彩云科技做对了

对于绝大多数AI创业者来说,AGI的

11-19 61阅读
()

()

血珀,一直是很多玩琥珀的朋友的心

11-19 55阅读
曝何炅KTV陪大姐喝酒视频,被搂肩一脸不悦,知情者曝真相

曝何炅KTV陪大姐喝酒视频,

11月18日,主持人何炅成为备受热议的对

11-19 61阅读
24岁影后李庚希被喊黑幕!曾被徐静蕾力捧没听倪萍劝告

24岁影后李庚希被喊黑幕!曾

11月16日晚,金鸡奖评选上曝出最大冷门

11-19 66阅读
扁鹊归宿地的怅惘(扁鹊归宿地的怅惘)

扁鹊归宿地的怅惘(扁鹊归宿

关键词:神医扁鹊 气死回生 讳疾忌医

11-19 60阅读
《最后生还者》新季明年春首播

《最后生还者》新季明年春

HBO及HBO Max首

11-19 63阅读
《如龙8外传 夏威夷海盗》演员采访视频:谷田步篇

《如龙8外传 夏威夷海盗》

世嘉公开了《人中之龙8外传Pirates in

11-19 61阅读
索尼正在开发自动检测游戏BUG的AI系统:简化测试流程

索尼正在开发自动检测游戏

根据 Tech4Gamer 报道,根据索尼目前发

11-19 61阅读
《战神:诸神黄昏》6.001补丁发布 优化手柄和显卡支持

《战神:诸神黄昏》6.001补

《战神:诸神黄昏》6.001更新版本着重解

11-19 67阅读
原子之心村子区域所有啁啾表位置详细介绍

原子之心村子区域所有啁啾

原子之心游戏的村子区域里面一共拥有4

11-19 62阅读
饥荒使用猪房无限刷猪的详细操作方法

饥荒使用猪房无限刷猪的详

在饥荒的游戏设定中,猪房每过3-4天会刷

11-19 62阅读