前沿模型推动人工智能边界突破

1个月前 科技 6观看
摘要 在人工智能行业内部,当人们讨论大型语言模型的具体工作原理时,经常使用"前沿模型"这一术语。但如果你不熟悉这个行业,可能并不真正了解这个词的含义。你可以从"前沿"这个词直观地理解,这些是各公

在人工智能行业内部,当人们讨论大型语言模型的具体工作原理时,经常使用"前沿模型"这一术语。J3b喜好网-记录每日喜好的科技时尚娱乐生活

但如果你不熟悉这个行业,可能并不真正了解这个词的含义。你可以从"前沿"这个词直观地理解,这些是各公司正在推进的最大、最优秀的新系统。J3b喜好网-记录每日喜好的科技时尚娱乐生活

描述前沿模型的另一种方式是将其称为"尖端"人工智能系统,它们用途广泛,是提升AI能力的整体框架。J3b喜好网-记录每日喜好的科技时尚娱乐生活

当询问ChatGPT时,它给出了三个标准——海量数据集、计算资源和复杂架构。J3b喜好网-记录每日喜好的科技时尚娱乐生活

以下是前沿模型的一些关键特征,有助于你理解这些模型的工作原理:J3b喜好网-记录每日喜好的科技时尚娱乐生活

首先是多模态性,前沿模型可能支持非文本输入和输出——如图像、视频或音频。换句话说,它们能够看和听,而不仅仅是读和写。J3b喜好网-记录每日喜好的科技时尚娱乐生活

另一个主要特征是零样本学习,系统在较少提示下就能展现更强的能力。J3b喜好网-记录每日喜好的科技时尚娱乐生活

还有那种类似智能体的行为,这让人们开始谈论"智能体AI"时代。J3b喜好网-记录每日喜好的科技时尚娱乐生活

**前沿模型实例**J3b喜好网-记录每日喜好的科技时尚娱乐生活

如果你想玩"猜模型"游戏,具体了解哪些公司在推进这项研究,你可以说OpenAI的GPT-4o代表了这样一个前沿模型,具有多模态和实时推理能力。或者你可以推崇Gemini 1.5的能力,它同样是多模态的,具有不错的上下文理解能力。J3b喜好网-记录每日喜好的科技时尚娱乐生活

你还可以指出许多其他在这类研究中表现出色的公司例子...但是,深入了解这些系统的构建如何?J3b喜好网-记录每日喜好的科技时尚娱乐生活

**剖析前沿领域格局**J3b喜好网-记录每日喜好的科技时尚娱乐生活

在最近的"行动中的想象力"专家小组讨论中,一支专家团队分析了在AI这一领域工作和创建前沿模型所需的条件。J3b喜好网-记录每日喜好的科技时尚娱乐生活

小组主持人Peter Grabowski为前沿模型介绍了两个相关概念——质量与充分性,以及多模态性。J3b喜好网-记录每日喜好的科技时尚娱乐生活

"我们已经看到了文本模型的大量工作,"他说。"我们已经看到了图像模型的大量工作。我们在视频或图像方面也看到了一些工作,但你可以轻松想象,这只是未来发展的开始。"J3b喜好网-记录每日喜好的科技时尚娱乐生活

Contextual AI首席执行官Douwe Kiela指出,前沿模型需要大量资源,并指出"AI是一个资源密集型的事业"。J3b喜好网-记录每日喜好的科技时尚娱乐生活

"我将成本与质量视为前沿,而那些实际上只需要在特定数据上训练的模型,实际上模型的鲁棒性就在那里,"Link Ventures董事总经理Lisa Dolan说(我也隶属于Link)。J3b喜好网-记录每日喜好的科技时尚娱乐生活

"我认为在性能方面仍有很大的增长空间,"Premji Invest副总裁Vedant Agrawal说。J3b喜好网-记录每日喜好的科技时尚娱乐生活

Agrawal还谈到了使用非专有基础模型的价值。J3b喜好网-记录每日喜好的科技时尚娱乐生活

"我们可以采用其他人训练的基础模型,然后让它们变得更好,"他说。"所以我们真正专注于构成这些系统的所有组件,以及我们如何在它们各自的小类别中与它们合作?"J3b喜好网-记录每日喜好的科技时尚娱乐生活

**基准测试和互操作性**J3b喜好网-记录每日喜好的科技时尚娱乐生活

小组还讨论了基准测试作为衡量这些前沿系统的方式。J3b喜好网-记录每日喜好的科技时尚娱乐生活

"基准测试是一个有趣的问题,因为它同时是研究领域中最好和最坏的事情,"他说。"我认为这是件好事,因为每个人都知道目标和他们要努力的方向,这也是件坏事,因为你很容易操纵系统。"J3b喜好网-记录每日喜好的科技时尚娱乐生活

这种"操纵系统"是如何工作的?Agrawal建议,真正以具体方式使用基准测试可能很困难。J3b喜好网-记录每日喜好的科技时尚娱乐生活

"对于不深入研究领域的人来说,很难看着基准测试表格说,'好吧,你得了99.4分,而其他人得了99.2分,'"他说。"很难将那0.2%的差异在现实世界中的真正含义进行情境化。"J3b喜好网-记录每日喜好的科技时尚娱乐生活

"我们查看基准测试,因为我们必须报告它们,但存在大量的基准测试疲劳,所以没人相信它,"Dolan说。J3b喜好网-记录每日喜好的科技时尚娱乐生活

后来,讨论了一些关于10倍系统的内容,以及收集和使用数据的一些方法:J3b喜好网-记录每日喜好的科技时尚娱乐生活

· 识别合同业务数据 · 使用合成数据 · 标注员团队J3b喜好网-记录每日喜好的科技时尚娱乐生活

当被问及这些系统的未来时,小组返回了这三个概念:J3b喜好网-记录每日喜好的科技时尚娱乐生活

· AI智能体 · 跨学科技术 · 非变换器架构J3b喜好网-记录每日喜好的科技时尚娱乐生活

观看视频可以获得小组关于前沿构建的其余评论。J3b喜好网-记录每日喜好的科技时尚娱乐生活

**前沿界面的未来形态**J3b喜好网-记录每日喜好的科技时尚娱乐生活

这里有一个有趣的补充——出于对我们将如何在10年后与这些前沿模型交互的兴趣,我向ChatGPT提出了这个问题。J3b喜好网-记录每日喜好的科技时尚娱乐生活

以下是我得到的一些回应:J3b喜好网-记录每日喜好的科技时尚娱乐生活

"你不会'打开'一个应用程序——它们将作为无处不在的后台智能体存在,对语音、凝视、情感或任务提示做出响应...你的AI知道你在开会,它读取你的情绪状态,听到正在说的话,并准备摘要+下一步行动——在你询问之前。"J3b喜好网-记录每日喜好的科技时尚娱乐生活

这结合了两个方面,即新系统可能的模式和感觉。J3b喜好网-记录每日喜好的科技时尚娱乐生活

这回到了个人化方法,我们开始更多地将这些模型视为同事和对话伙伴,而不是从计算机屏幕上凝视你的东西。J3b喜好网-记录每日喜好的科技时尚娱乐生活

换句话说,PC-DOS命令行系统的时代已经结束。Windows将计算机界面从单行单色系统改变为色彩鲜艳的窗口、重新框架和基于工具的桌面方法的充满活力的系统。J3b喜好网-记录每日喜好的科技时尚娱乐生活

前沿模型将为我们的界面进步感做得更多。J3b喜好网-记录每日喜好的科技时尚娱乐生活

这将是巨大的变化。敬请期待。J3b喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
苹果打算明年带来AirTag 2,或与M4 MacBook Air一起发布

苹果打算明年带来AirTag 2,或与M4

在202

11-19 121阅读
超204万人预约华为Mate 70:纯血鸿蒙+麒麟芯自研完全体来了

超204万人预约华为Mate 70:纯血鸿

11月19日

11-19 130阅读
咖啡界“老二”闭店上百家,星巴克们开始慌了?

咖啡界“老二”闭店上百家,星巴克

星巴

11-19 105阅读
点名小杨哥、贾乃亮,美邦创始人不走寻常路

点名小杨哥、贾乃亮,美邦创始人不

11月1

11-19 120阅读
腾讯的AI困局

腾讯的AI困局

文章来源:科技新知图片来源:由无界

11-19 113阅读
这次,李庚希“底裤被扒光”,孙红雷的话,终于有人信了

这次,李庚希“底裤被扒光”

11-19 101阅读
长安十二时辰龙波是好是坏 龙波扮演者是谁资料作品介绍(长安十二时辰龙波是好是坏)

长安十二时辰龙波是好是坏

《长安十二时辰》这部剧正在热播,在

11-19 99阅读
要回归了?李奈映透露丈夫元斌正在选剧本 有望复出拍戏

要回归了?李奈映透露丈夫元

47岁韩国男星元斌,凭着帅气

11-19 100阅读
电影《朝花夕拾》将映   张珊萌担任制片人及主演

电影《朝花夕拾》将映

  “积谷防饥,养儿防老”,关注乡村“

11-19 106阅读
吐槽黄焖鸡不要点的博主被禁言:自称不是骑手 作品都是段子

吐槽黄焖鸡不要点的博主被

11月19日消息,据

11-19 106阅读
城市天际线秘籍代码及使用方法详细介绍

城市天际线秘籍代码及使用

《城市:天际线》是以建造和管理城市为题

11-19 103阅读
小小突击队礼包码,小小突击队周年礼包码2023.9

小小突击队礼包码,小小突击

小小突击队礼包码来啦!这次为大家带来的

11-19 105阅读
原子之心激光模块解谜攻略

原子之心激光模块解谜攻略

原子之心游戏里面有一个被动安保激光模

11-19 112阅读
饥荒蜘蛛网超详细获取方法分享

饥荒蜘蛛网超详细获取方法

蜘蛛网是饥荒游戏里面的一个常用材料,有

11-19 124阅读
原神智慧之神的踪影任务流程|原神智慧之神的踪影攻略

原神智慧之神的踪影任务流

原神智慧之神的踪影是须弥地区魔神主线

11-19 111阅读