AI 代理在 2025 年:企业领导者需要了解什么

7个月前 科技 37观看
摘要 "2025 年将是 AI 代理的元年。"等等——我们不是在 2023 年就说过这句话了吗?当时,我在播客中谈到了 AI 模型的链式连接。人们对 AI 的兴奋度空前高涨,到了 2024 年,许多公司争相尝试

"2025 年将是 AI 代理的元年。"等等——我们不是在 2023 年就说过这句话了吗?当时,我在播客中谈到了 AI 模型的链式连接。人们对 AI 的兴奋度空前高涨,到了 2024 年,许多公司争相尝试生成式 AI,有些甚至使用了链式模型。但这些项目中有许多未能扩大规模。为什么?因为它们只是测试项目,没有集成到系统基础设施中,或者缺乏防护措施和质量控制。这种情况将在 2025 年得到改变,但产品面临的挑战依然存在。要了解 AI 代理在 2025 年能做什么,让我们考虑一个简单的例子:一个自动回复电子邮件的工具。想象一个能自动起草邮件回复的系统。这个例子展示了企业在使用 AI 代理时面临的机遇和挑战。GtB喜好网-记录每日喜好的科技时尚娱乐生活

为什么 GPT 封装器不是企业级 AIGtB喜好网-记录每日喜好的科技时尚娱乐生活

构建邮件回复工具最简单的方法是使用 GPT 封装器。我在 2024 年看到了许多这样的例子。这些基本设置将 AI 连接到一个小型界面。对于我们的用例而言,这意味着获取 ChatGPT API 密钥,编写一些代码来接收邮件作为输入,添加一个提示告诉 AI 该做什么,然后在一个干净的界面上显示响应。GtB喜好网-记录每日喜好的科技时尚娱乐生活

系统提示: 像 Lutz 一样回答。Lutz 总是以"祝好!"结束他的消息。GtB喜好网-记录每日喜好的科技时尚娱乐生活

输入: 嗨 Lutz,邀请你周四共进晚餐。你能来吗?祝好,Tim。GtB喜好网-记录每日喜好的科技时尚娱乐生活

输出: 谢谢,Tim!让我查看一下日程安排,我很快会回复你的。祝好!GtB喜好网-记录每日喜好的科技时尚娱乐生活

即使在这个简单的例子中,当前企业 AI 也面临几个关键挑战:GtB喜好网-记录每日喜好的科技时尚娱乐生活

没有系统集成: 该工具无法查看我的日历来确认我是否有空。GtB喜好网-记录每日喜好的科技时尚娱乐生活

缺乏上下文: 它不知道我是否喜欢 Tim 或避免这类活动。GtB喜好网-记录每日喜好的科技时尚娱乐生活

没有安全保障: 如果邮件询问私人信息,比如我的社会安全号码,该怎么办?GtB喜好网-记录每日喜好的科技时尚娱乐生活

缺乏防护措施: 它如何处理有争议的问题,比如询问政治观点?GtB喜好网-记录每日喜好的科技时尚娱乐生活

缺乏用户控制: 用户在塑造 AI 回复方面有多大的输入权?GtB喜好网-记录每日喜好的科技时尚娱乐生活

幻觉: AI 有时会编造信息,正如 ChatGPT 页面上的警告不断提醒我们的:"ChatGPT 可能会犯错。"GtB喜好网-记录每日喜好的科技时尚娱乐生活

大语言模型在总结或充当界面等任务方面表现出色,但仅凭它们是不够的。正如我在 eCornell 证书课程中强调的,每个挑战都可以得到解决。让我们通过在工作流程中构建 AI 代理来改进我们的工具。GtB喜好网-记录每日喜好的科技时尚娱乐生活

AI 代理的工作流程:不仅仅是生成式 AIGtB喜好网-记录每日喜好的科技时尚娱乐生活

AI 模型可以连接或"链接"以构建工作流程,其中一个模型的输出成为下一个模型的输入。这就像 Zapier 或 IFTTT 这样的工具,但由 AI 驱动。与固定步骤不同,这个过程是动态的,能适应每种情况。这些工作流程并不总是依赖于像 ChatGPT 这样的生成式 AI。实际上,它们经常不依赖——生成式 AI 可能太慢且成本高。GtB喜好网-记录每日喜好的科技时尚娱乐生活

以下是我们的邮件工具可能的工作方式:GtB喜好网-记录每日喜好的科技时尚娱乐生活

输入: 嗨 Lutz,邀请你周四共进晚餐。你能来吗?祝好,Tim。GtB喜好网-记录每日喜好的科技时尚娱乐生活

系统提示: 分析邮件并确定回复所需的步骤。GtB喜好网-记录每日喜好的科技时尚娱乐生活

系统输出: (1) 查看日历,确认用户是否有空。(2) 查找与 Tim 的往来邮件和以往的晚餐邀请。(3) 根据过去的行为预测用户参加的可能性。(4) 创建三份回复草稿:一份接受,一份婉拒,一份询问更多细节。GtB喜好网-记录每日喜好的科技时尚娱乐生活

系统执行: 执行列出的步骤。GtB喜好网-记录每日喜好的科技时尚娱乐生活

输出: 向用户呈现这三个回复选项。GtB喜好网-记录每日喜好的科技时尚娱乐生活

这就是链式 AI 模型的工作方式。它克服了许多早期的问题。但大语言模型只是众多工具中的一个。GtB喜好网-记录每日喜好的科技时尚娱乐生活

所有工具都需要集成和质量检查。例如,我们的设置涉及:GtB喜好网-记录每日喜好的科技时尚娱乐生活

系统集成: 查看日历和提取数据不是 AI,但需要系统连接。GtB喜好网-记录每日喜好的科技时尚娱乐生活

上下文搜索: 使用 AI 检索相关的过往互动(称为 RAG 或检索增强生成)。GtB喜好网-记录每日喜好的科技时尚娱乐生活

传统 AI: 预测参加可能性使用经典的数据分析。GtB喜好网-记录每日喜好的科技时尚娱乐生活

用户设计: 提供多个选项改善了可用性和控制。GtB喜好网-记录每日喜好的科技时尚娱乐生活

简而言之,这是关于产品工作——创造可靠和有价值的解决方案。GtB喜好网-记录每日喜好的科技时尚娱乐生活

2025 年 - 企业级 AI 代理GtB喜好网-记录每日喜好的科技时尚娱乐生活

2025 年将是 AI 代理的一年。AI 将简化、增强或自动化各行各业的工作流程。但不会有一个"杀手级应用"。如果存在这样的应用,它很可能是搜索——请参见我对搜索的预测。相反,我们将看到较小的工作流程应用于客户服务(参见我在 ultimate.ai 的投资)、法律支持(参见 flank.io)或销售(参见我的公司 r2decide.com)等领域。GtB喜好网-记录每日喜好的科技时尚娱乐生活

要构建这些解决方案,工程师和产品经理需要专注于创造价值。在我的课程"设计和构建 AI 解决方案"中,我教授了一个实用框架,用于为媒体、金融、医疗保健、电子商务和其他行业的企业客户创造价值:GtB喜好网-记录每日喜好的科技时尚娱乐生活

1. 定义业务目标。 2. 收集和清理数据。 3. 开发代理工作流程。 4. 与用户测试。 5. 创建反馈循环。GtB喜好网-记录每日喜好的科技时尚娱乐生活

这听起来很简单,但需要考虑许多因素,包括解决偏见和伦理问题等风险。最重要的是,重点必须放在价值创造上。让我们一起构建。GtB喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
苹果打算明年带来AirTag 2,或与M4 MacBook Air一起发布

苹果打算明年带来AirTag 2,或与M4

在202

11-19 130阅读
小米手机下次相机版本更新增加水印颜色选项,老机型也会版本迭代

小米手机下次相机版本更新增加水

11 月

11-19 113阅读
特斯拉与上汽讨论两轮FSD授权?官方回应

特斯拉与上汽讨论两轮FSD授权?官

11月1

11-19 96阅读
可栗口语完成数百万元天使轮融资

可栗口语完成数百万元天使轮融资

近日,A

11-19 107阅读
打工人,靠新中式按摩“续命”

打工人,靠新中式按摩“续命”

26岁

11-19 117阅读
雷佳音:再获金鸡影帝,拥抱四美台上哽咽,不忘向张艺谋要手机号

雷佳音:再获金鸡影帝,拥抱四

11-19 126阅读
《假日暖洋洋》姚晨与小11岁白宇演 姐弟恋 ,别说,还真甜(假日暖洋洋姚晨与小11岁白宇演)

《假日暖洋洋》姚晨与小11

有生之年,欣喜相逢。 我是温暖,欢迎

11-19 112阅读
莎拉波娃涉嫌欺诈? 网球巨星竟有这样的污点究竟是怎么回事

莎拉波娃涉嫌欺诈? 网球巨

如果是非常关注体育界的话,莎拉波

11-19 105阅读
中国电影出海专业书刊《走向世界:华语电影的跨国流通与市场策略》正式发布

中国电影出海专业书刊《走

  在首届广州电影产业博览交易会上

11-19 122阅读
20岁大学生开车26天去上学引百万人围观:从中国南京开到英国杜伦

20岁大学生开车26天去上学

“我真的做到了!

11-19 118阅读
奥特曼格斗进化0怎么放大招?奥特曼格斗进化0攻略

奥特曼格斗进化0怎么放大

《奥特曼格斗进化0》游戏中可以操控各

11-19 152阅读
原子之心巴浦洛夫综合体区域死者位置分享

原子之心巴浦洛夫综合体区

原子之心游戏中的巴浦洛夫综合体区域里

11-19 112阅读
原神尽在咫尺的目标任务怎么做|尽在咫尺的目标任务攻略

原神尽在咫尺的目标任务怎

尽在咫尺的目标是原神须弥地区魔神主线

11-19 113阅读
原神赤王时代的沙漠与大赤沙海任务全流程攻略

原神赤王时代的沙漠与大赤

赤王时代的沙漠与大赤沙海是原神须弥地

11-19 132阅读
饥荒超详细驯服牦牛技巧分享

饥荒超详细驯服牦牛技巧分

在饥荒游戏里面玩家可以驯服牦牛,而且根

11-19 119阅读