前沿模型的工作方式:与AI智能对话的新时代

3天前 科技 2观看
摘要 在行业内部,当人们讨论大语言模型的具体工作原理时,经常使用"前沿模型"这一术语。但如果你不在这个行业内,可能并不真正了解这个概念的含义。你可以直观地理解"前沿"这个词,知道这些是各大公司正

在行业内部,当人们讨论大语言模型的具体工作原理时,经常使用"前沿模型"这一术语。wbo喜好网-记录每日喜好的科技时尚娱乐生活

但如果你不在这个行业内,可能并不真正了解这个概念的含义。你可以直观地理解"前沿"这个词,知道这些是各大公司正在推进的最新、最优秀的系统。wbo喜好网-记录每日喜好的科技时尚娱乐生活

描述前沿模型的另一种方式是将其定义为"尖端"AI系统,具有广泛的应用目标,是提升AI能力的整体框架。wbo喜好网-记录每日喜好的科技时尚娱乐生活

当被询问时,ChatGPT给出了三个标准——海量数据集、计算资源和复杂架构。wbo喜好网-记录每日喜好的科技时尚娱乐生活

以下是前沿模型的一些关键特征,帮助你更好地理解这些模型的工作原理:wbo喜好网-记录每日喜好的科技时尚娱乐生活

首先是多模态性,前沿模型很可能支持非文本输入和输出——包括图像、视频或音频。换句话说,它们能够看和听——不仅仅是读和写。wbo喜好网-记录每日喜好的科技时尚娱乐生活

另一个重要特征是零样本学习,系统在更少提示下具备更强的能力。wbo喜好网-记录每日喜好的科技时尚娱乐生活

还有那种类似智能体的行为,这让人们开始谈论"智能体AI"时代。wbo喜好网-记录每日喜好的科技时尚娱乐生活

前沿模型的实例wbo喜好网-记录每日喜好的科技时尚娱乐生活

如果你想玩"识别模型"游戏,具体了解哪些公司在推进这项研究,你可以说OpenAI的GPT 4o代表了一种前沿模型,具有多模态和实时推理能力。或者你可以推崇Gemini 1.5的能力,它同样是多模态的,具有不错的上下文处理能力。wbo喜好网-记录每日喜好的科技时尚娱乐生活

你还可以指出许多其他在这类研究方面表现出色的公司例子...但是:深入了解这些系统的构建过程如何?wbo喜好网-记录每日喜好的科技时尚娱乐生活

分析前沿技术格局wbo喜好网-记录每日喜好的科技时尚娱乐生活

在最近的"行动中的想象力"小组讨论中,一组专家分析了在AI领域这一部分工作并创建这些前沿模型所需的条件。wbo喜好网-记录每日喜好的科技时尚娱乐生活

小组主持人Peter Grabowski为前沿模型介绍了两个相关概念——质量与充分性,以及多模态性。wbo喜好网-记录每日喜好的科技时尚娱乐生活

"我们已经看到了文本模型的大量工作,"他说。"我们看到了图像模型的很多工作。我们看到了一些视频或图像方面的工作,但你可以轻易想象,这只是未来发展的开始。"wbo喜好网-记录每日喜好的科技时尚娱乐生活

Contextual AI的CEO Douwe Kiela指出,前沿模型需要大量资源,他提到"AI是一个非常资源密集的事业。"wbo喜好网-记录每日喜好的科技时尚娱乐生活

Link Ventures的董事总经理Lisa Dolan说:"我将成本与质量视为前沿,这些模型实际上只需要在特定数据上进行训练,但模型的稳健性是存在的。"(我也隶属于Link公司。)wbo喜好网-记录每日喜好的科技时尚娱乐生活

Premji Invest的副总裁Vedant Agrawal说:"我认为在性能方面仍有很大的增长空间。"wbo喜好网-记录每日喜好的科技时尚娱乐生活

Agrawal还谈到了使用非专有基础模型的价值。wbo喜好网-记录每日喜好的科技时尚娱乐生活

"我们可以采用其他人训练的基础模型,然后让它们变得更好,"他说。"所以我们真正专注于构成这些系统的所有组件,以及我们如何在它们各自的小类别中使用它们?"wbo喜好网-记录每日喜好的科技时尚娱乐生活

基准测试和互操作性wbo喜好网-记录每日喜好的科技时尚娱乐生活

小组还讨论了基准测试作为衡量这些前沿系统的方法。wbo喜好网-记录每日喜好的科技时尚娱乐生活

"基准测试是一个有趣的问题,因为它单独来看既是研究世界中最好的东西,也是最糟糕的东西,"他说。"我认为它是好事,因为每个人都知道目标和他们努力的方向,但它也是坏事,因为你可以轻易地钻系统的空子。"wbo喜好网-记录每日喜好的科技时尚娱乐生活

这种"钻系统空子"是如何工作的?Agrawal建议,真正以具体方式使用基准测试可能很困难。wbo喜好网-记录每日喜好的科技时尚娱乐生活

"对于不深入研究领域的人来说,很难看着基准测试表格说,'好吧,你得了99.4分,而其他人得了99.2分,'"他说。"很难将0.2%的差异在现实世界中的真正含义进行情境化。"wbo喜好网-记录每日喜好的科技时尚娱乐生活

Dolan说:"我们会查看基准测试,因为我们必须报告它们,但存在大量的基准测试疲劳,所以没人相信它。"wbo喜好网-记录每日喜好的科技时尚娱乐生活

后来,讨论了一些关于10倍系统的话题,以及收集和使用数据的一些方法:wbo喜好网-记录每日喜好的科技时尚娱乐生活

· 识别合同业务数据 · 使用合成数据 · 标注员团队wbo喜好网-记录每日喜好的科技时尚娱乐生活

当被问及这些系统的未来时,小组返回了这三个概念:wbo喜好网-记录每日喜好的科技时尚娱乐生活

· AI智能体 · 跨学科技术 · 非变换器架构wbo喜好网-记录每日喜好的科技时尚娱乐生活

观看视频了解小组关于前沿构建的其余评论。wbo喜好网-记录每日喜好的科技时尚娱乐生活

前沿界面将是什么样子wbo喜好网-记录每日喜好的科技时尚娱乐生活

这里有个有趣的补充——对于10年后我们将如何与这些前沿模型交互感兴趣,我向ChatGPT提出了这个问题。wbo喜好网-记录每日喜好的科技时尚娱乐生活

以下是我得到的一些回答:wbo喜好网-记录每日喜好的科技时尚娱乐生活

"你不会'打开'一个应用程序——它们将作为无处不在的后台智能体存在,响应语音、凝视、情感或任务提示...你的AI知道你在开会,它读取你的情绪状态,听到所说的话,并准备摘要+下一步行动——在你询问之前。"wbo喜好网-记录每日喜好的科技时尚娱乐生活

这结合了两个方面,即新系统可能具有的模式和感觉。wbo喜好网-记录每日喜好的科技时尚娱乐生活

这回到了个人化方法,我们开始更多地将这些模型视为同事和对话伙伴,而不是从计算机屏幕上凝视你的东西。wbo喜好网-记录每日喜好的科技时尚娱乐生活

换句话说,PC-DOS命令行系统的时代已经结束。Windows将计算机界面从单行单色系统改变为充满活力的彩色窗口、重新构架和基于工具的桌面方法。wbo喜好网-记录每日喜好的科技时尚娱乐生活

前沿模型将为我们的界面进展感知做得更多。wbo喜好网-记录每日喜好的科技时尚娱乐生活

这将是巨大的变化。敬请关注。wbo喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
首发1999元 华硕ROG新款25寸显示器上市:FHD 310Hz屏

首发1999元 华硕ROG新款25寸显示

11月19日

11-19 84阅读
映泰推出 MT-N97 工业计算机:无风扇设计,配英特尔 N97 处理器

映泰推出 MT-N97 工业计算机:无风

11 月

11-19 79阅读
灵初智能完成天使轮融资

灵初智能完成天使轮融资

近日,

11-19 78阅读
一单只挣几块钱,年轻人追捧的代炒是门好生意吗?

一单只挣几块钱,年轻人追捧的代炒

杭州

11-19 84阅读
为什么说MEMS-OXC在智算场景没有未来?

为什么说MEMS-OXC在智算场景没有

智算中心是这一轮科技革命的算力

11-19 79阅读
“嫖娼门”王全安:前任个个赛西施,花800元睡站台女,终遭报应

“嫖娼门”王全安:前任个个

11-19 83阅读
龙波 始终亲力亲为,哪个岗位有需要就扑在哪里 优秀新闻工作者 编辑⑨(龙波始终亲力亲为)

龙波 始终亲力亲为,哪个岗

为激励全市新闻战线认真践行“四向

11-19 82阅读
长安十二时辰龙波是好是坏 龙波扮演者是谁资料作品介绍(长安十二时辰龙波是好是坏)

长安十二时辰龙波是好是坏

《长安十二时辰》这部剧正在热播,在

11-19 78阅读
释彦能:银幕硬汉,反派巅峰——正邪交锋,票房破亿传奇!

释彦能:银幕硬汉,反派巅峰—

  在当今动作电影的舞台上,释彦能以

11-19 79阅读
三傻变劳拉

三傻变劳拉

跨度太大,玩家一

11-19 77阅读
《严阵以待》DLC“深水”Steam页面开放 发售日待定

《严阵以待》DLC“深水”S

今日(11月16日),《严阵以待》DLC「Dark W

11-19 94阅读
帝国时代4秘籍大全2024_帝国时代4国家崛起秘籍作弊码大全(含隐藏秘籍)

帝国时代4秘籍大全2024_帝

帝国时代4是帝国时代4系列游戏的最新版

11-19 122阅读
帝国时代2秘籍大全_帝国时代2征服者/高清版秘籍(含隐藏秘籍)

帝国时代2秘籍大全_帝国时

帝国时代2秘籍是很多玩帝国时代2游戏玩

11-19 184阅读
饥荒联机版怎么调中文?饥荒联机版中文设置方法

饥荒联机版怎么调中文?饥荒

饥荒联机版是目前很多玩家在玩的一个版

11-19 92阅读
饥荒宠物洞召唤宠物所需物品一览

饥荒宠物洞召唤宠物所需物

宠物洞是饥荒游戏里面的一个特殊场景,在

11-19 83阅读