广告

Transformer的记忆形成机制被发现与大脑惊人相似

2023-12-19 16:31:26 基础科学研究所 (IBS)  阅读:
Transformer 模型似乎使用了类似于大脑 NMDA 受体的看门过程。这一发现促使研究人员研究 Transformer 的记忆巩固是否可以通过类似于 NMDA 受体门控过程的机制来控制。

由基础科学研究所 (IBS) 认知与社会性中心和数据科学组的研究人员组成的跨学科团队发现,人工智能 (AI) 模型的记忆处理与人脑海马体之间存在惊人的相似性。这项新发现为记忆巩固提供了一个新的视角,而记忆巩固是人工智能系统中将短期记忆转化为长期记忆的一个过程。s6wednc

开发通用人工智能 (AGI) 的竞赛中,在 OpenAI 和 Google DeepMind 等有影响力的实体的引领下,理解和复制类人智能已成为一个重要的研究兴趣。这些技术进步的核心是 Transformer 模型,其基本原理现在正在得到新的深度探索。s6wednc

强大的人工智能系统的关键是掌握它们学习和记忆信息的方式。研究小组将人脑学习的原理,特别是通过海马体中的 NMDA 受体进行记忆巩固的原理,应用到了人工智能模型中。s6wednc

NMDA 受体就像大脑中的一扇智能门,促进学习和记忆形成。当存在一种称为谷氨酸的大脑化学物质时,神经细胞会受到兴奋。另一方面,镁离子充当挡住门的小守门人。只有当这个离子守门人退到一边时,物质才允许流入细胞。这是大脑创造和保存记忆的过程,而看门人(镁离子)在整个过程中的作用是非常具体的。s6wednc

s6wednc

(a) 图示突触后神经元离子通道活动的图表。 AMPA 受体参与突触后神经元的激活,而 NMDA 受体会被镁离子 (Mg²⁺) 阻断,但当突触后神经元充分激活时,会通过钙离子 (Ca²⁺) 的流入诱导突触可塑性。 (b) 表示 Transformer AI 模型内计算过程的流程图。信息通过前馈层、归一化层和自注意力层等阶段顺序处理。描绘 NMDA 受体电流-电压关系的图表与前馈层的非线性非常相似。基于镁 (α) 浓度的输入输出图显示了 NMDA 受体非线性的变化。图片来源:基础科学研究所s6wednc

该团队有了一个新发现:Transformer 模型似乎使用了类似于大脑 NMDA 受体的看门过程。这一发现促使研究人员研究 Transformer 的记忆巩固是否可以通过类似于 NMDA 受体门控过程的机制来控制。s6wednc

在动物大脑中,低镁水平会削弱记忆功能。研究人员发现,Transformer 中的长期记忆可以通过模仿 NMDA 受体来改善。s6wednc

就像在大脑中一样,镁含量的变化会影响记忆强度,调整 Transformer 的参数以反映 NMDA 受体的门控作用可以增强 AI 模型的记忆力。这一突破性的发现表明,人工智能模型的学习方式可以用神经科学的既定知识来解释。s6wednc

该研究所的神经科学家主任 C. Justin Lee 表示:“这项研究在推进人工智能和神经科学方面迈出了关键的一步。它使我们能够更深入地研究大脑的运行原理,并根据这些见解开发更先进的人工智能系统。”s6wednc

该团队和韩国科学技术院的数据科学家 CHA Meeyoung 指出:“与需要大量资源的大型人工智能模型不同,人类大脑以最少的能量运行,这一点非常出色。我们的工作为低成本、高性能的人工智能系统开辟了新的可能性,这些系统可以像人类一样学习和记住信息。”s6wednc

这项研究的与众不同之处在于它主动将受大脑启发的非线性纳入人工智能结构中,这标志着在模拟类人记忆巩固方面取得了重大进展。人类认知机制和人工智能设计的融合不仅有望创建低成本、高性能的人工智能系统,而且还可以通过人工智能模型提供对大脑工作方式的宝贵见解。s6wednc

Demi Xia编译s6wednc

责编:Demi
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了