Deepmind "预测地图"论文背后:神经科学或将助力深度学习迎来新突破

对人类神经网络的理解越来越在左右人工智能的未来研究,连Deepmind也不例外。

2017年10月2日,《NATURE NEUROSCIENCE》发表了Deepmind的一篇《The hippocampus as a predictive map》的论文。这篇论文中,Deepmind通过对主管人类长期记忆行为的“海马体”(hippocampus)神经元活动的研究,进一步提出了可以转化为神经网络架构的“预测图”理论。

在博客中,Deepmind这样写到:

“传统观点认为海马体只表示动物的现状,尤其在执行走迷宫之类的空间任务中。这种观点在发现啮齿动物的海马体中的“位置细胞”后被广泛传播,当动物处于特定位置时,它们会选择性地放电。虽然这个理论解释了许多神经生理学发现,但并不完全解释为什么海马体也参与其他功能,包括记忆,关系推理和决策等。

我们认为,海马体用它们预测到的未来状态来展示代表每一种情况。例如,如果你要下班回家(你当前的状态),你的海马体可能会预测你很可能很快会通勤回家,到学校接孩子,或者更长远一点——到家了。海马体预测这些后期状态来表现出当前的状态,从而传达了对未来事件的摘要表达,也就是我们正式说的“后续表征”(Sucessor Representation)。我们认为,这种具体形式的预测图可以让大脑在奖励不断变化的环境中快速适应,而无需运行代价昂贵的未来模拟。

这一理论启发我们在新算法中结合了基于模型的算法的灵活性和无模型算法中的高效性,由于计算只是简单的加权相加,因此该算法的计算效率与无模型算法相当,同时,通过分离奖励期望与期望状态(预测地图),该算法可以通过简单的更新奖励期望值并保持状态期望值不变,从而快速适应奖励变化。”

(老鼠在探索方形房间时记录下来的海马体每个位置细胞的活动及放电率的变化)

这并不是Deepmind的第一篇神经科学用于人工智能的论文,在此之前Deepmind就表过至少两篇创始人Hassabis为作者的神经科学论文(参见雷锋网之前文章:《DeepMind眼中的神经科学研究:人工智能进步的另一个重要支点》),这篇文章作者中虽然不包括Hassabis,但相对于前两篇论文更加具体,对未来的研究也更具有指导意义。

神经网络发展史

人工智能的发展与神经系统有着千丝万缕的联系。在1943年,Warren McCulloch和Walter Pitts的《 神经活动内在想法的逻辑演算 》第一次提出了如何让人造神经元网络实现逻辑功能,这也奠定了神经网络最早的数学基础和开启了人们模拟人脑神经系统开发人工智能(虽然当时还没有这个词)的早期尝试。

模仿人类神经系统的问题是:人类大脑神经系统实在太复杂了。在人类大脑神经系统中包含10^11(10的11次方)的神经元,即便现在也难以模拟。在1958年,Frank Rosenblatt通过解剖大鼠的大脑发布了一个模仿神经元的感知机,当时有研究者认为,只要神经元足够多、网络连接足够复杂,感知机就至少可以模拟部分人类智力,但在1969年,Marvin Minsky和Seymour Papert证明了感知机只能解决线性问题,还揭露了关于多层感知器的缺陷,这使得人工神经网络研究在人工智能领域很快就陷入了低谷,被基于规则和逻辑推理的专家系统所取代。

1974年,一位叫Geffory Hinton的年轻研究者发现,把多个感知机连接成一个分层的网络,即可以解决Minsky的问题。这带动了80年代连接主义的兴起,这个阶段的连接理论最初被称为分布式并行处理PDP (parallel distributed processing),他们以人工神经网络为工具方法,引领着神经科学和人工智能领域的发展,与行为学派和符号学派三足鼎立。

随之而来的问题是,如果要模拟人类大脑数量如此庞大的神经元,可能需要对几百甚至上千个参数进行调节,如何对这样复杂的网络进行训练呢?Hinton等人的发现是,通过反向传播算法可以解决多层网络的训练问题。这一算法是用来训练人工神经网络的常见方法,该方法计算对网络中所有权重计算损失函数的梯度。这个梯度会反馈给最优化方法,用来更新权值以最小化损失函数。

神经网络的现代分类器的各个方面也受到了我们所了解的大脑的视觉系统的启发。这方面研究的先驱包括Geoffrey Hinton、Yann LeCun、Yoshua Bengio等人,1998年,Yann LeCun提出了卷积神经网络(CNN),2006年,Hinton提出了深度学习的概念并在其经典论文《A fast learning alforithm for deep belief nets》中提出了深度信念网络,带来了深度学习直到今天的黄金时代;2009年,Yoshua Bengio提出了深度学习的常用模型堆叠自动编码器(Stacked Auto-Encoder,SAE),基于神经网络的研究得到进一步发扬光大。

然而人工智能专家基于神经系统的研究和思考并没有停止。如脑科学的研究结果表明,大脑中神经元的信号处理机制和连接学习方式是不同的,尤其是大脑的无意识感知和自我意识功能并不需要有监督的学习,在大脑神经系统中,非监督学习和自主学习同样占有重要的地位,相应地,对于无监督学习和迁移学习的研究也成为人工智能的热点之一。

而随着深度学习和神经科学的发展,之前对深度学习的一些基础理论也在面临着更新。例如在深度学习领域,神经元是最底层的单元;而在神经科学领域,神经元并不是最底层的单位。目前的深度神经网络主要是三种结构,即 DNN(全连接的)、CNN(卷积)和 RNN(循环),而目前的研究表明,人类神经网络可能比较类似上述三种结构的组合,层内更像DNN, 层间和CNN 很类似,在时间上展开就是RNN。这种结构上的差异也导致了深度学习研究的复杂性。

来源: Neocortical layer 6, a review & 知乎

深度学习正在面临一个拐点——一方面,基于我们最初基于人脑结构认识的理论研究已经到了一个平台期,而另一方面,如Hinton等最尖端的深度学习专家也在借助神经科学的最新发现,对之前对提出的理论进行反思,这也是近日Hinton就提出“深度学习需要推倒重来”,并表示可能要彻底放弃反向传播的由来(参见雷锋网文章:《Geffory Hinton:深度学习进入平台期?不,深度学习需要的是“推倒重来”》)。

在与OReilly的一次访谈中,Hinton曾经承认我们对人类神经系统的了解并不足够。“我们真不知道为什么神经元要发脉冲。一个理论是它们想要噪声,以便正则化,因为我们的参数超过数据量。”Hinton在访谈中说道。“这个理论已经出现有50多年了,但没人知道它是否正确。”

神经科学和对人脑的模仿在人工智能中曾经起着重要的作用,而对于模仿人类大脑,是否能制造出最强大的人工智能,在不同人工智能学家眼里可能会有不同的答案。一个时常被提起的例子是,我们之所以能造出飞机,是因为空气动力学的发展而并非模仿鸟类飞行的动作,但雷锋网(公众号:雷锋网)认为,这种从仿生到理论的循环可能是一种螺旋式的上升过程,新的神经系统发现和研究可能会推翻之前的人工智能经典理论,并随之模拟出新的人工智能网络和产生新的理论,从而推动人工智能的研究突破瓶颈得到进一步发展。

本文作者:岑大师

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-16 17:14:18

Deepmind "预测地图"论文背后:神经科学或将助力深度学习迎来新突破的相关文章

【DeepMind最新Nature论文】探索人类行为中的强化学习机制

DeepMind与来自普林斯顿.NYU.达特茅斯学院.UCL和哈佛大学的研究人员合作,探索了人类行为中的强化学习,为开发智能体强化学习提供了新的策略.研究人员具体探讨了一种存在于无模型和基于模型的学习算法之间的方法,基于后继表示(successor representation,SR),将长期状态预测存入缓存中.作者预计,这些发现将为计算科学.电生理学和神经影像学研究开辟新的途径去研究评估机制的神经基础.相关论文<The successor representation in human rei

126篇殿堂级深度学习论文分类整理 从入门到应用 | 干货

如果你有非常大的决心从事深度学习,又不想在这一行打酱油,那么研读大牛论文将是不可避免的一步.而作为新人,你的第一个问题或许是:"论文那么多,从哪一篇读起?" 本文将试图解决这个问题--文章标题本来是:"从入门到绝望,无止境的深度学习论文".请诸位备好道具,开启头悬梁锥刺股的学霸姿势. 开个玩笑. 但对非科班出身的开发者而言,读论文的确可以成为一件很痛苦的事.但好消息来了--为避免初学者陷入迷途苦海,昵称为 songrotek 的学霸在 GitHub 发布了他整理的深

【独家】深度学习论文阅读路线图

如果你是深度学习领域的一名新手,可能会遇到的第一个问题是"应该从哪篇论文开始读起呢?" 这里给出了深度学习论文阅读路线图! 路线图按照下面四个准则构建而成: 从提纲到细节 从经典到前沿 从通用领域到特定领域 专注于最先进的技术 你将会发现很多近期发表但是确实值得一读的论文. 我们将持续不断的给这条路线图添加论文. 1 深度学习历史和基础 1.0  书籍 1.1调查 1.2 深度信念网络(DBN) (深度学习开篇的里程碑) 1.3 ImageNet进展(深度学习从此爆发) 1.4语音识别

深度学习论文阅读路线图

1.深度学习历史和基础 1.0  书籍 1.1调查 1.2 深度信念网络(DBN) (深度学习开篇的里程碑) 1.3 ImageNet进展(深度学习从此爆发) 1.4语音识别进展 阅读完上面这些论文后,通过对深度学习模型(包括CNN,RNN,LSTM)的基础框架,以及深度学习如何应用于图像和语音识别问题的理解,你将会对深度学习的历史有一个基本的认识.下面的论文将带你深入理解深度学习模型,深度学习在不同领域的应用和前沿.我们建议你根据自己的兴趣和研究方向选择下面的论文进行阅读. 2深度学习方法 2

(zhuan) 126 篇殿堂级深度学习论文分类整理 从入门到应用

126 篇殿堂级深度学习论文分类整理 从入门到应用 | 干货 雷锋网  作者: 三川 2017-03-02 18:40:00 查看源网址 阅读数:66     如果你有非常大的决心从事深度学习,又不想在这一行打酱油,那么研读大牛论文将是不可避免的一步.而作为新人,你的第一个问题或许是:"论文那么多,从哪一篇读起?" 本文将试图解决这个问题--文章标题本来是:"从入门到绝望,无止境的深度学习论文".请诸位备好道具,开启头悬梁锥刺股的学霸姿势. 开个玩笑. 但对非科班出

【NIPS2017】大会议程最全盘点,7位重磅嘉宾报告,DeepMind、Facebook论文汇总

12月4日,也就是下周一,一年一度的NIPS就要正式召开了.这届NIPS从售票(提前2个月售完)到赞助(赞助商太多关闭赞助通道),屡屡创下新高.待到正式开幕,数千名研究人员和参会者"挤挤一堂",绝非夸张. 那么,作为新智元NIPS系列报道的第一篇,我们将在本文中做一个初步的全景式介绍,包括会议信息,比如大会的Chair.Tutorial和Workshop情况,大会亮点,比如受邀报告,以及DeepMind.Facebook这些顶级研究院的工作. 会议赞助:瞥见当前AI产业势力分布缩影 翻

DeepMind最新论文:人工智能可以从旧概念中创造新概念

大约2500年前,一个美索不达米亚的商人使用陶器.木制品和簧片作为流通货币,这改变了人类经济的发展历史.后来,美索不达米亚的商人又使用"算盘"来记录的他们商品,调整财政政策,这促成了经济的蓬勃发展. 在这些灵感乍现的时候恰恰折射出了人类具有惊人的能力:能够整合现有的概念,并构想出一些全新的概念.许多不为人知的发明家曾不得不考虑他们想要解决的问题是什么,可能制造出怎样的装置以及要思考建立这些装置所需要的原材料是什么,例如,粘土可以通过模具压成平板,簧片可以充当计数器.这些物体都具有相似性

【智驾深谈】深度学习驱动的自动驾驶新主流框架盘点(附3篇论文)

大背景 基于深度学习架构的人工智能如今已被广泛应用于计算机视觉.自然语言处理.传感器融合.目标识别.自动驾驶等汽车行业的各个领域,从自动驾驶初创企业.互联网公司到各大OEM厂商,都正在积极探索通过利用GPU构建神经网络实现最终的自动驾驶.   高阶ADAS系统的开发以至自动驾驶系统的开发都有赖于一套能够完整支持开发.模拟测试.原型制作和量产的开放式解决方案.本文将介绍基于深度学习架构的自动驾驶平台,这一架构将成为未来实现自动驾驶的集成平台中的重要一环.   深度学习是什么   深度学习是目前人工

CVPR2017精彩论文解读:直接处理三维点云的深度学习模型

雷锋网(公众号:雷锋网) AI 科技评论按:虽然CVPR 2017已经落下帷幕,但对精彩论文的解读还在继续.下文是Momenta高级研究员陈亮对此次大会收录的 PointNet:Deep Learning on Point Sets for 3D Classification and Segmentation  一文进行的解读. 随着激光雷达,RGBD相机等3D传感器在机器人,无人驾驶领域的广泛应用.针对三维点云数据的研究也逐渐从低层次几何特征提取( PFH, FPFH,VFH等)向高层次语义理