AI 代理在 2025 年:企业领导者需要了解什么

4个月前 科技 24观看
摘要 "2025 年将是 AI 代理的元年。"等等——我们不是在 2023 年就说过这句话了吗?当时,我在播客中谈到了 AI 模型的链式连接。人们对 AI 的兴奋度空前高涨,到了 2024 年,许多公司争相尝试

"2025 年将是 AI 代理的元年。"等等——我们不是在 2023 年就说过这句话了吗?当时,我在播客中谈到了 AI 模型的链式连接。人们对 AI 的兴奋度空前高涨,到了 2024 年,许多公司争相尝试生成式 AI,有些甚至使用了链式模型。但这些项目中有许多未能扩大规模。为什么?因为它们只是测试项目,没有集成到系统基础设施中,或者缺乏防护措施和质量控制。这种情况将在 2025 年得到改变,但产品面临的挑战依然存在。要了解 AI 代理在 2025 年能做什么,让我们考虑一个简单的例子:一个自动回复电子邮件的工具。想象一个能自动起草邮件回复的系统。这个例子展示了企业在使用 AI 代理时面临的机遇和挑战。73q喜好网-记录每日喜好的科技时尚娱乐生活

为什么 GPT 封装器不是企业级 AI73q喜好网-记录每日喜好的科技时尚娱乐生活

构建邮件回复工具最简单的方法是使用 GPT 封装器。我在 2024 年看到了许多这样的例子。这些基本设置将 AI 连接到一个小型界面。对于我们的用例而言,这意味着获取 ChatGPT API 密钥,编写一些代码来接收邮件作为输入,添加一个提示告诉 AI 该做什么,然后在一个干净的界面上显示响应。73q喜好网-记录每日喜好的科技时尚娱乐生活

系统提示: 像 Lutz 一样回答。Lutz 总是以"祝好!"结束他的消息。73q喜好网-记录每日喜好的科技时尚娱乐生活

输入: 嗨 Lutz,邀请你周四共进晚餐。你能来吗?祝好,Tim。73q喜好网-记录每日喜好的科技时尚娱乐生活

输出: 谢谢,Tim!让我查看一下日程安排,我很快会回复你的。祝好!73q喜好网-记录每日喜好的科技时尚娱乐生活

即使在这个简单的例子中,当前企业 AI 也面临几个关键挑战:73q喜好网-记录每日喜好的科技时尚娱乐生活

没有系统集成: 该工具无法查看我的日历来确认我是否有空。73q喜好网-记录每日喜好的科技时尚娱乐生活

缺乏上下文: 它不知道我是否喜欢 Tim 或避免这类活动。73q喜好网-记录每日喜好的科技时尚娱乐生活

没有安全保障: 如果邮件询问私人信息,比如我的社会安全号码,该怎么办?73q喜好网-记录每日喜好的科技时尚娱乐生活

缺乏防护措施: 它如何处理有争议的问题,比如询问政治观点?73q喜好网-记录每日喜好的科技时尚娱乐生活

缺乏用户控制: 用户在塑造 AI 回复方面有多大的输入权?73q喜好网-记录每日喜好的科技时尚娱乐生活

幻觉: AI 有时会编造信息,正如 ChatGPT 页面上的警告不断提醒我们的:"ChatGPT 可能会犯错。"73q喜好网-记录每日喜好的科技时尚娱乐生活

大语言模型在总结或充当界面等任务方面表现出色,但仅凭它们是不够的。正如我在 eCornell 证书课程中强调的,每个挑战都可以得到解决。让我们通过在工作流程中构建 AI 代理来改进我们的工具。73q喜好网-记录每日喜好的科技时尚娱乐生活

AI 代理的工作流程:不仅仅是生成式 AI73q喜好网-记录每日喜好的科技时尚娱乐生活

AI 模型可以连接或"链接"以构建工作流程,其中一个模型的输出成为下一个模型的输入。这就像 Zapier 或 IFTTT 这样的工具,但由 AI 驱动。与固定步骤不同,这个过程是动态的,能适应每种情况。这些工作流程并不总是依赖于像 ChatGPT 这样的生成式 AI。实际上,它们经常不依赖——生成式 AI 可能太慢且成本高。73q喜好网-记录每日喜好的科技时尚娱乐生活

以下是我们的邮件工具可能的工作方式:73q喜好网-记录每日喜好的科技时尚娱乐生活

输入: 嗨 Lutz,邀请你周四共进晚餐。你能来吗?祝好,Tim。73q喜好网-记录每日喜好的科技时尚娱乐生活

系统提示: 分析邮件并确定回复所需的步骤。73q喜好网-记录每日喜好的科技时尚娱乐生活

系统输出: (1) 查看日历,确认用户是否有空。(2) 查找与 Tim 的往来邮件和以往的晚餐邀请。(3) 根据过去的行为预测用户参加的可能性。(4) 创建三份回复草稿:一份接受,一份婉拒,一份询问更多细节。73q喜好网-记录每日喜好的科技时尚娱乐生活

系统执行: 执行列出的步骤。73q喜好网-记录每日喜好的科技时尚娱乐生活

输出: 向用户呈现这三个回复选项。73q喜好网-记录每日喜好的科技时尚娱乐生活

这就是链式 AI 模型的工作方式。它克服了许多早期的问题。但大语言模型只是众多工具中的一个。73q喜好网-记录每日喜好的科技时尚娱乐生活

所有工具都需要集成和质量检查。例如,我们的设置涉及:73q喜好网-记录每日喜好的科技时尚娱乐生活

系统集成: 查看日历和提取数据不是 AI,但需要系统连接。73q喜好网-记录每日喜好的科技时尚娱乐生活

上下文搜索: 使用 AI 检索相关的过往互动(称为 RAG 或检索增强生成)。73q喜好网-记录每日喜好的科技时尚娱乐生活

传统 AI: 预测参加可能性使用经典的数据分析。73q喜好网-记录每日喜好的科技时尚娱乐生活

用户设计: 提供多个选项改善了可用性和控制。73q喜好网-记录每日喜好的科技时尚娱乐生活

简而言之,这是关于产品工作——创造可靠和有价值的解决方案。73q喜好网-记录每日喜好的科技时尚娱乐生活

2025 年 - 企业级 AI 代理73q喜好网-记录每日喜好的科技时尚娱乐生活

2025 年将是 AI 代理的一年。AI 将简化、增强或自动化各行各业的工作流程。但不会有一个"杀手级应用"。如果存在这样的应用,它很可能是搜索——请参见我对搜索的预测。相反,我们将看到较小的工作流程应用于客户服务(参见我在 ultimate.ai 的投资)、法律支持(参见 flank.io)或销售(参见我的公司 r2decide.com)等领域。73q喜好网-记录每日喜好的科技时尚娱乐生活

要构建这些解决方案,工程师和产品经理需要专注于创造价值。在我的课程"设计和构建 AI 解决方案"中,我教授了一个实用框架,用于为媒体、金融、医疗保健、电子商务和其他行业的企业客户创造价值:73q喜好网-记录每日喜好的科技时尚娱乐生活

1. 定义业务目标。 2. 收集和清理数据。 3. 开发代理工作流程。 4. 与用户测试。 5. 创建反馈循环。73q喜好网-记录每日喜好的科技时尚娱乐生活

这听起来很简单,但需要考虑许多因素,包括解决偏见和伦理问题等风险。最重要的是,重点必须放在价值创造上。让我们一起构建。73q喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
拼多多「隐身」双十一

拼多多「隐身」双十一

纵然是在互联互通的大背景下,双十

11-19 65阅读
日本导演神山健治执导 动画电影《指环王:洛汗之战》内地定档12月14日

日本导演神山健治执导 动画电影

11月19日

11-19 63阅读
SVM频闪指标低的旗舰!iQOO Neo10系列屏幕参数出炉

SVM频闪指标低的旗舰!iQOO Neo10

11月18日

11-19 70阅读
李子柒复更,三大平台提前过年

李子柒复更,三大平台提前过年

停更1

11-19 64阅读
刚刚,OpenAI发布Windows版ChatGPT,高级语音能用了

刚刚,OpenAI发布Windows版ChatGPT

图片来源:由无界AI生成今天凌晨2

11-19 67阅读
后台被这剧催爆了

后台被这剧催爆了

11-19 73阅读
李诞真名叫什么? 误打误撞踏入演艺圈!

李诞真名叫什么? 误打误撞

《吐槽大会》第四季第一集播出之

11-19 70阅读
烈火军校易柏辰演的谁? 经纪人曝假剧本事件始末起底

烈火军校易柏辰演的谁? 经

前段时间,演员易柏辰方发文称曾被

11-19 70阅读
余凯宁个人资料, 余凯宁原名余天翊

余凯宁个人资料, 余凯宁原

余凯宁,原名余天翊,演员。1994年9月

11-19 67阅读
贾乃亮帮清购物车, 网友没胆安利给自家老板!

贾乃亮帮清购物车, 网友没

今天双十二,大家剁手了吗!小编是没

11-19 62阅读
与柴犬开启治愈探险之旅!异世界动作冒险新游《妖怪之国》登陆Steam

与柴犬开启治愈探险之旅!异

在这个繁忙喧嚣的现代社会,我们时常渴

11-19 74阅读
三国群英传7秘籍大全_三国群英传7所有秘籍代码一览

三国群英传7秘籍大全_三国

三国群英传7游戏支持秘籍功能,玩家可以

11-19 64阅读
卧龙苍天陨落怎么提升武将好感度?提升武将好感度的方法分享

卧龙苍天陨落怎么提升武将

卧龙苍天陨落怎么提升武将好感度?在卧龙

11-19 67阅读
ePSXe模拟器安卓版怎么导入游戏?ePSXe模拟器安卓版导入游戏教程

ePSXe模拟器安卓版怎么导

ePSXe模拟器安卓版是一款非常棒的可以

11-19 98阅读
原神疗养观察任务流程|原神疗养观察攻略

原神疗养观察任务流程|原

原神疗养观察是游戏中须弥地区魔神任务

11-19 67阅读