《中国人工智能学会通讯》——4.15 关联滤波器

4.15 关联滤波器

1 . 动因
在灵长类的大脑视觉皮层系统中,有一类对亮度敏感的神经细胞,它们的接受域都由一个圆环及其内部的圆形部分组成[5] 。这些细胞可以分为两类:① on-center/off-surround 细胞,对黑暗背景上的亮点敏感。② off-center/on-surround 细胞,对亮背景上的暗点敏感。这两类细胞负责视觉信息的早期处理,主要观察空间中亮度的变化。而滤波器在CNN 中也扮演着接受域的角色,受此启发,我们使用 Caltech101 的图片数据集训练了一个由普通卷积层组成的简单 CNN,并观察训练时滤波器的变化过程。在网络训练收敛之后,发现若干滤波器也具有相反的关联关系,尽管这些滤波器都是随机初始化和使用普通梯度下降方法训练的,如图 1 所示。
除此之外,这种相反的关联只出现在输入层后紧跟着的第一个卷积层,与视觉皮层中具有相反接受域的神经细胞所处位置一致。更进一步地,我们在更深的卷积层中探寻类似的关联关系,从而发现某些参与输出同一特征图的滤波器具有平移关联,如图 2 所示。图中的四个滤波器同样采用随机初始化,却表现出了竖直方向平移的关联性。考虑到所有的滤波器都是使用普通反向传播方法训练生成的,这种算法只是将权值朝减小代价函数的方向更新,每个滤波器之间的训练并没有联系。但这些关联性却又总是稳定地存在,所以这种关联性不是偶然的,而很有可能是高效提取视觉特征的必要条件。
基于以上的观察,我们想到在训练网络之前就预先人工设定这些关联,至少能够加速网络模型整体的收敛速度。目前已经实现了反向关联和平移关联。

2 . 相反关联滤波器
在部署相反关联滤波器时,首先需要在一个普通卷积神经层中随机地选取若干对滤波器,以构造关联。为了与实际观察相一致,这些滤波器都来自紧挨着原始输入图像的卷积层,并且分别用于生成不同的输出特征图。在每一对相反关联滤波器中,一个滤波器成为主滤波器,另外一个则是从滤波器,这两个滤波器矩阵的对应位置元素相反,如图3所示。
(a) 在训练前随机初始化的两个示例滤波器(b) 上述两个滤波器训练之后,几乎完全相反图 1 训练普通 CNN 后观察到的滤波器相反关联性图 2 训练普通 CNN 后观察到的滤波器平移相关性在开始迭代训练之前,我们将从滤波器初始化为主滤波器的相反值。除此之外,为了保证在每一次迭代周期后从滤波器都能保持与其主滤波器互反,还需要对其反向传播时的残差添加修正。公式(1) 与公式 (2) 分别描述了主滤波器和从滤波器的更新向量。
其中, 表示主滤波器在第i个周期的更新偏移量,则表示与之对应的从滤波器在第 i 个周期的更新偏移量; 是主滤波器在第 i 个周期的残差;m和 l 则分别表示冲量因子和学习率,两者都是常量。公式中所述的权值更新方法实质上将主 / 从滤波器的权值视为一个整体,综合两者的残差即求得这一对滤波器的更新矢量。除此之外,卷积层中蕴含的相反关联滤波器的数量可以灵活控制,在保证滤波器多样性的前提下,这些关联滤波器对能够稳定提取不同明暗条件下的同种特征。

  1. 平移关联滤波器
    平移关联滤波器在很多方面都与相反关联滤波器类似。首先,我们仍然将滤波器分为若干组来体现关联性,每一组也依旧包含主 / 从滤波器。但每个主滤波器拥有两个从滤波器,分别是将主滤波器以相反的两个方向平移获得。在此基础上,平移关联滤波器组又分为两个类别,分别表示水平方向的平移以及垂直方向的平移。遵照图 2 中发现关联的位置,平移关联滤波器作为一种处理抽象特征的方法被应用于深层次的卷积神经层中。

如图 4 所示,对于某一个从滤波器而言,它的一半的权值被设置为与其主滤波器的对应部分相同,剩余的另一半权值则由自由训练得到,不受关联影响。这些被关联的权值分别位于主 / 从滤波器的不同位置,由此产生的平移关系能够保证轻微偏移的特征仍然能被检测到。同相反关联滤波器相类似,我们也需要为被关联的权值增加残差修正:对于主滤波器中的每一个权值,如果它也出现在从滤波器中,则将主 / 从滤波器中的残差加和作为最终的残差。这种修正综合考虑了主 / 从双方的需求,使得被关联的滤波器在协同处理的同时,稳定地沿着梯度方向收敛。
将相反滤波器和平移滤波器应用到 NiN [11] 中描述的网络结构上,使用相同的数据扩增方法,我们在 CIFAR-10 数据集上获得了 7.75% 的错误率,优于 NiN 给出的 8.81%。

时间: 2024-09-12 10:54:26

《中国人工智能学会通讯》——4.15 关联滤波器的相关文章

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍

中国人工智能学会通讯——混合智能概念与新进展

脑科学以阐明脑的工作原理为目标,近年来已成为最重要的科学前沿领域之一.脑功能计算.脑智能模仿再度成为学术界和产业界热议话题[1-4].欧盟.美国.日本相继启动了大型脑研究计划,强有力推动了人们对脑结构.脑功能和脑智能的探索和认识:另一方面,人工智能研究风起云涌,最近一个标志性事件是谷歌的AlphaGo以4:1战胜围棋世界冠军李世石[5],实现了围棋人工智能领域史无前例的突破.2016年9月斯坦福大学发布了<2030年的人工智能与生活>报告[6],全面评估了当前人工智能的进展.挑战.机遇与展望.

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——智创未来 未来已来

2016 年带着我们难忘的记忆,就这样翻篇了.由我们学会发起.全国多个组织积极参与的.纪念全球人工智能 60 年的一个个系列活动历历在目,在我们身边发生的种种无人驾驶的比赛和试验活动还在让我们激动不已,AlphaGo 战胜人类围棋冠军李世石的震荡被 Master 的新战绩推向又一个新高潮,时间就这样把我们带入了新的一年--2017 年. 对 2017 年的人工智能,我们会有什么期待呢? 深度学习会火 无人驾驶会火 机器人产业会火 机器同传会火 人机博弈会火 交互认知会火 不确定性人工智能会火 智

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——Master虽优势较多 但仍有缺陷

近日,Master 在各大围棋网站横扫顶尖职业棋手,随后,谷歌 DeepMind 创始人德米什 • 哈萨比斯在 Twitter 上发布消息,证实了 Master 是 AlphaGo 的升级版.众所周知,围棋困难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆:同时状态空间大,也没有全局的结构.这两点加起来,迫使目前计算机只能用穷举法,并且因此进展缓慢.但人能下得好,能在几百个选择中知道哪几个位置值得考虑,说明它的估值函数是有规律的.这些规律远远不是几条简单公式所能概括,但所需的信息量