AI 是否有自己的语言?AI 心理学的三个方面

4个月前 科技 22观看
摘要 长期以来,至少从 AI 的角度来看,人们一直在讨论大语言模型的黑盒问题。人类天性就想要完全理解事物 - 想要看清机器的内部运作机制,无论是时钟、计算器还是机器人。但在当今世界,有些事物我们无

长期以来,至少从 AI 的角度来看,人们一直在讨论大语言模型的黑盒问题。wED喜好网-记录每日喜好的科技时尚娱乐生活

人类天性就想要完全理解事物 - 想要看清机器的内部运作机制,无论是时钟、计算器还是机器人。wED喜好网-记录每日喜好的科技时尚娱乐生活

但在当今世界,有些事物我们无法完全观察。换句话说,某些复杂系统往往难以分析。wED喜好网-记录每日喜好的科技时尚娱乐生活

探索 AI 的冒险wED喜好网-记录每日喜好的科技时尚娱乐生活

我正在阅读 Alexander Kruel 在 Substack 上发表的一篇文章,他对 Claude 及其推理能力提出了一些惊人的见解,引用了一个大型团队撰写的有关该模型的一些内部资料。wED喜好网-记录每日喜好的科技时尚娱乐生活

看看他对这个大语言模型能力的推断中的这一要点:wED喜好网-记录每日喜好的科技时尚娱乐生活

"Claude 可以说数十种语言 - (它在'大脑'中使用的是什么语言,如果有的话?)"wED喜好网-记录每日喜好的科技时尚娱乐生活

在我深入探讨大语言模型和语言语法的具体观点之前,我想指出论文作者承认,在以这种方式探索 AI 的意识时,他们是借鉴了传统神经科学和人脑研究的方法。用他们的话说(同样来自十多位作者):wED喜好网-记录每日喜好的科技时尚娱乐生活

"我们从神经科学领域获得灵感,该领域长期以来一直在研究思维生物的复杂内部机制,我们试图构建一种 AI 显微镜,让我们能够识别活动模式和信息流。仅仅通过与 AI 模型对话能学到的东西是有限的——毕竟,人类(即使是神经科学家)也不完全了解我们自己大脑的运作方式。所以我们要深入内部观察。"wED喜好网-记录每日喜好的科技时尚娱乐生活

我认为这很贴切:是的,有机人脑确实是"复杂"的 - 这是肯定的。wED喜好网-记录每日喜好的科技时尚娱乐生活

那么,当你将这个 AI 显微镜应用于模型的行为时,你会看到什么?wED喜好网-记录每日喜好的科技时尚娱乐生活

以下是作者指出的三点,我认为这些对理解这些模型如何工作至关重要。wED喜好网-记录每日喜好的科技时尚娱乐生活

思维语言wED喜好网-记录每日喜好的科技时尚娱乐生活

首先,在研究了 Claude 3.5 Haiku 之后,一些参与该项目的人认为,Claude 有自己的通用"思维语言",这种语言结合了多种世界语言。wED喜好网-记录每日喜好的科技时尚娱乐生活

他们写道:"我们通过将简单句子翻译成多种语言,并追踪 Claude 处理这些句子时的重叠方式来证明这一点。"wED喜好网-记录每日喜好的科技时尚娱乐生活

就模型的思维方式而言,这本身就是一个重大发现。我们中的许多人可能会认为它们主要用英语思考。但这种实践探索表明情况并非如此。wED喜好网-记录每日喜好的科技时尚娱乐生活

例如,研究追踪了英语、中文和法语中"big"或"large"这些词的使用,并进行比较,显示了模型工作中产生这些重叠模式的各个方面。wED喜好网-记录每日喜好的科技时尚娱乐生活

照亮 Claude 的大脑wED喜好网-记录每日喜好的科技时尚娱乐生活

这里另一个重要的见解是,人类科学家无法看到 Claude 所做的一切,只能看到一部分。wED喜好网-记录每日喜好的科技时尚娱乐生活

他们写道:"我们认识到我们当前方法的局限性。即使在简短的提示下,我们的方法也只能捕捉到 Claude 执行的总计算的一小部分,而且我们看到的机制可能会基于我们的工具产生一些不能反映底层模型实际情况的假象。"wED喜好网-记录每日喜好的科技时尚娱乐生活

还有进一步的解释:wED喜好网-记录每日喜好的科技时尚娱乐生活

"即使对于只有几十个词的提示,目前需要几个小时的人力才能理解我们看到的电路。要扩展到支持现代模型使用的复杂思维链的数千个词,我们需要改进方法,并且(可能在 AI 的帮助下)改进我们理解所见的方式。"wED喜好网-记录每日喜好的科技时尚娱乐生活

为什么会这样?为什么人类不能直接读取模型的输出?一种解释是这不是线性编程。在线性编程中,你可以一步一步地观察,看到机器在做的每一件事。但正如我在过去三四年参加的大多数会议和讲座中指出的那样,我们现在已经超越了这个阶段。wED喜好网-记录每日喜好的科技时尚娱乐生活

探索语言之外wED喜好网-记录每日喜好的科技时尚娱乐生活

这里有一点与语法关系不大,而是更多地关系到当你观察大语言模型行为时在研究什么。wED喜好网-记录每日喜好的科技时尚娱乐生活

作为一个典型的例子,作者注意到模型通常会"回避"某些话题或对话方向,除非有什么因素抑制其默认响应,否则会拒绝回答问题。我们知道机器经常被"编程"以确保安全,远离暴力或令人反感的路径,但这似乎又远不止于此,涉及机器"偏好"拒绝某些提示。wED喜好网-记录每日喜好的科技时尚娱乐生活

了解那个"什么"是什么,什么是刺激因素,将有助于理解机器何时选择回答人类问题。仅此一点就将大大推进人工神经学的研究。wED喜好网-记录每日喜好的科技时尚娱乐生活

值得再次指出的是,就像我们无法完全理解 AI 在认知上在做什么一样,我们也不能完全理解我们的大脑在认知上在做什么。wED喜好网-记录每日喜好的科技时尚娱乐生活

所以在观察人类思维和 AI 思维时存在某种对等性。也许我们无法完全理解所有这些数字神经元在做什么是很恰当的。我们能做的是从外部进行观察,通过实践获取信息。wED喜好网-记录每日喜好的科技时尚娱乐生活

所有这些都为人们现在使用革命性模型的工作提供了信息。随着我们发现更多关于它们能力的信息,能够追踪 AI 思维的"如何"将变得非常有价值。wED喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
五环外接不住马拉松“泼天富贵”

五环外接不住马拉松“泼天富贵”

11月10日,这个寻常的周末,全国有十

11-19 124阅读
问界理想的新擂台:问界M8 VS 理想L8

问界理想的新擂台:问界M8 VS 理想

要说近年来什么行业最“卷”,相信

11-19 107阅读
小米汽车发布智能底盘预研技术,实现多种高难度动作‌

小米汽车发布智能底盘预研技术,实

11-19 104阅读
中银300亿母基金加速推进

中银300亿母基金加速推进

银行

11-19 106阅读
大模型的效率腾飞,彩云科技做对了什么?

大模型的效率腾飞,彩云科技做对了

对于绝大多数AI创业者来说,AGI的

11-19 104阅读
《假日暖洋洋》姚晨与小11岁白宇演 姐弟恋 ,别说,还真甜(假日暖洋洋姚晨与小11岁白宇演)

《假日暖洋洋》姚晨与小11

有生之年,欣喜相逢。 我是温暖,欢迎

11-19 110阅读
余凯宁个人资料, 余凯宁原名余天翊

余凯宁个人资料, 余凯宁原

余凯宁,原名余天翊,演员。1994年9月

11-19 124阅读
冯小刚和范冰冰关系不简单, 冯小刚力挺范冰冰复出引众怒

冯小刚和范冰冰关系不简单

众所周知范爷范冰冰在还没被封杀

11-19 106阅读
陶喆深夜送美女回家, 疑似再次出轨遭经纪人否认!

陶喆深夜送美女回家, 疑似

陶喆也算是家喻户晓的歌星了,曾经

11-19 121阅读
《权利的游戏》二丫结局是什么?她杀死了夜王?

《权利的游戏》二丫结局是

《权利的游戏》二丫结局是什在美

11-19 105阅读
《彩虹六号:围攻》“COLLISION POINT行动”12月3日推出

《彩虹六号:围攻》“COLLIS

中国,上海– 2024年11月18日 – 今天,

11-19 129阅读
《天穗之咲稻姬外传》确定制作 本篇Steam平台限时促销中

《天穗之咲稻姬外传》确定

Marvelous Inc.(代表取缔役社长:佐藤澄宣

11-19 128阅读
重装机兵4失落密码大全_重装机兵4所有失落密码一览

重装机兵4失落密码大全_重

失落密码是《重装机兵4》游戏里面的一

11-19 317阅读
N网怎么开启18+开关?NEXUSMODS开启18+开关的详细操作教程

N网怎么开启18+开关?NEXUS

N网怎么开启18+开关?N网全称NEXUSMODS,是

11-19 131阅读
原神疗养观察任务流程|原神疗养观察攻略

原神疗养观察任务流程|原

原神疗养观察是游戏中须弥地区魔神任务

11-19 104阅读