AI 是否有自己的语言?AI 心理学的三个方面

1个月前 科技 8观看
摘要 长期以来,至少从 AI 的角度来看,人们一直在讨论大语言模型的黑盒问题。人类天性就想要完全理解事物 - 想要看清机器的内部运作机制,无论是时钟、计算器还是机器人。但在当今世界,有些事物我们无

长期以来,至少从 AI 的角度来看,人们一直在讨论大语言模型的黑盒问题。HhB喜好网-记录每日喜好的科技时尚娱乐生活

人类天性就想要完全理解事物 - 想要看清机器的内部运作机制,无论是时钟、计算器还是机器人。HhB喜好网-记录每日喜好的科技时尚娱乐生活

但在当今世界,有些事物我们无法完全观察。换句话说,某些复杂系统往往难以分析。HhB喜好网-记录每日喜好的科技时尚娱乐生活

探索 AI 的冒险HhB喜好网-记录每日喜好的科技时尚娱乐生活

我正在阅读 Alexander Kruel 在 Substack 上发表的一篇文章,他对 Claude 及其推理能力提出了一些惊人的见解,引用了一个大型团队撰写的有关该模型的一些内部资料。HhB喜好网-记录每日喜好的科技时尚娱乐生活

看看他对这个大语言模型能力的推断中的这一要点:HhB喜好网-记录每日喜好的科技时尚娱乐生活

"Claude 可以说数十种语言 - (它在'大脑'中使用的是什么语言,如果有的话?)"HhB喜好网-记录每日喜好的科技时尚娱乐生活

在我深入探讨大语言模型和语言语法的具体观点之前,我想指出论文作者承认,在以这种方式探索 AI 的意识时,他们是借鉴了传统神经科学和人脑研究的方法。用他们的话说(同样来自十多位作者):HhB喜好网-记录每日喜好的科技时尚娱乐生活

"我们从神经科学领域获得灵感,该领域长期以来一直在研究思维生物的复杂内部机制,我们试图构建一种 AI 显微镜,让我们能够识别活动模式和信息流。仅仅通过与 AI 模型对话能学到的东西是有限的——毕竟,人类(即使是神经科学家)也不完全了解我们自己大脑的运作方式。所以我们要深入内部观察。"HhB喜好网-记录每日喜好的科技时尚娱乐生活

我认为这很贴切:是的,有机人脑确实是"复杂"的 - 这是肯定的。HhB喜好网-记录每日喜好的科技时尚娱乐生活

那么,当你将这个 AI 显微镜应用于模型的行为时,你会看到什么?HhB喜好网-记录每日喜好的科技时尚娱乐生活

以下是作者指出的三点,我认为这些对理解这些模型如何工作至关重要。HhB喜好网-记录每日喜好的科技时尚娱乐生活

思维语言HhB喜好网-记录每日喜好的科技时尚娱乐生活

首先,在研究了 Claude 3.5 Haiku 之后,一些参与该项目的人认为,Claude 有自己的通用"思维语言",这种语言结合了多种世界语言。HhB喜好网-记录每日喜好的科技时尚娱乐生活

他们写道:"我们通过将简单句子翻译成多种语言,并追踪 Claude 处理这些句子时的重叠方式来证明这一点。"HhB喜好网-记录每日喜好的科技时尚娱乐生活

就模型的思维方式而言,这本身就是一个重大发现。我们中的许多人可能会认为它们主要用英语思考。但这种实践探索表明情况并非如此。HhB喜好网-记录每日喜好的科技时尚娱乐生活

例如,研究追踪了英语、中文和法语中"big"或"large"这些词的使用,并进行比较,显示了模型工作中产生这些重叠模式的各个方面。HhB喜好网-记录每日喜好的科技时尚娱乐生活

照亮 Claude 的大脑HhB喜好网-记录每日喜好的科技时尚娱乐生活

这里另一个重要的见解是,人类科学家无法看到 Claude 所做的一切,只能看到一部分。HhB喜好网-记录每日喜好的科技时尚娱乐生活

他们写道:"我们认识到我们当前方法的局限性。即使在简短的提示下,我们的方法也只能捕捉到 Claude 执行的总计算的一小部分,而且我们看到的机制可能会基于我们的工具产生一些不能反映底层模型实际情况的假象。"HhB喜好网-记录每日喜好的科技时尚娱乐生活

还有进一步的解释:HhB喜好网-记录每日喜好的科技时尚娱乐生活

"即使对于只有几十个词的提示,目前需要几个小时的人力才能理解我们看到的电路。要扩展到支持现代模型使用的复杂思维链的数千个词,我们需要改进方法,并且(可能在 AI 的帮助下)改进我们理解所见的方式。"HhB喜好网-记录每日喜好的科技时尚娱乐生活

为什么会这样?为什么人类不能直接读取模型的输出?一种解释是这不是线性编程。在线性编程中,你可以一步一步地观察,看到机器在做的每一件事。但正如我在过去三四年参加的大多数会议和讲座中指出的那样,我们现在已经超越了这个阶段。HhB喜好网-记录每日喜好的科技时尚娱乐生活

探索语言之外HhB喜好网-记录每日喜好的科技时尚娱乐生活

这里有一点与语法关系不大,而是更多地关系到当你观察大语言模型行为时在研究什么。HhB喜好网-记录每日喜好的科技时尚娱乐生活

作为一个典型的例子,作者注意到模型通常会"回避"某些话题或对话方向,除非有什么因素抑制其默认响应,否则会拒绝回答问题。我们知道机器经常被"编程"以确保安全,远离暴力或令人反感的路径,但这似乎又远不止于此,涉及机器"偏好"拒绝某些提示。HhB喜好网-记录每日喜好的科技时尚娱乐生活

了解那个"什么"是什么,什么是刺激因素,将有助于理解机器何时选择回答人类问题。仅此一点就将大大推进人工神经学的研究。HhB喜好网-记录每日喜好的科技时尚娱乐生活

值得再次指出的是,就像我们无法完全理解 AI 在认知上在做什么一样,我们也不能完全理解我们的大脑在认知上在做什么。HhB喜好网-记录每日喜好的科技时尚娱乐生活

所以在观察人类思维和 AI 思维时存在某种对等性。也许我们无法完全理解所有这些数字神经元在做什么是很恰当的。我们能做的是从外部进行观察,通过实践获取信息。HhB喜好网-记录每日喜好的科技时尚娱乐生活

所有这些都为人们现在使用革命性模型的工作提供了信息。随着我们发现更多关于它们能力的信息,能够追踪 AI 思维的"如何"将变得非常有价值。HhB喜好网-记录每日喜好的科技时尚娱乐生活

展开全文
猜你感兴趣
OPPO Reno 13 系列手机外观公布,代言人宋雨琦

OPPO Reno 13 系列手机外观公布,

11 月

11-19 64阅读
天玑9400性能之神!iQOO Neo10系列前瞻

天玑9400性能之神!iQOO Neo10系列

今天,iQOO

11-19 65阅读
TGA 2024 提名名单将于 11 月 19 日北京时间公布

TGA 2024 提名名单将于 11 月 19

11-19 68阅读
吉利牛仔轻越野SUV广州车展预售,配备Flyme Auto系统‌

吉利牛仔轻越野SUV广州车展预售,

11-19 56阅读
这个东北小镇,拿捏年轻人的第一件貂

这个东北小镇,拿捏年轻人的第一件

你会

11-19 65阅读
李诞真名叫什么? 误打误撞踏入演艺圈!

李诞真名叫什么? 误打误撞

《吐槽大会》第四季第一集播出之

11-19 65阅读
斗鱼第一土豪落天神身份曝光, 花钱如流水居然是这样的身份!

斗鱼第一土豪落天神身份曝

如果很早就看直播的网友,想必都听

11-19 61阅读
戈壁和江百丽结局,男方不爱女方,女生到最后一无所有

戈壁和江百丽结局,男方不爱

《暗恋橘生淮南》中江百丽和戈壁

11-19 153阅读
中国世界电影学会|2024·法国优秀影片展映圆满落幕

中国世界电影学会|2024·法

  由中国世界电影学会、中国文联电

11-19 64阅读
最美《变形金刚》女主梅根福克斯怀孕登热搜 网友谈样貌:咋成卡戴珊了...

最美《变形金刚》女主梅根

11月12日消息,知

11-19 62阅读
《星刃》开发商否认《胜利女神》将改编动画的传言

《星刃》开发商否认《胜利

《星刃》对于开发商Shift Up而言是一

11-19 68阅读
《严阵以待》DLC“深水”Steam页面开放 发售日待定

《严阵以待》DLC“深水”S

今日(11月16日),《严阵以待》DLC「Dark W

11-19 69阅读
玩转无忧传奇行会系统,成就宏图霸业

玩转无忧传奇行会系统,成就

行会是无忧传奇中一个非常重要的组成部

11-19 66阅读
小小突击队礼包码,小小突击队周年礼包码2023.9

小小突击队礼包码,小小突击

小小突击队礼包码来啦!这次为大家带来的

11-19 63阅读
原神失物匿于繁华任务怎么做|失物匿于繁华任务攻略

原神失物匿于繁华任务怎么

失物匿于繁华是原神须弥地区魔神主线任

11-19 60阅读