自动化所马佳彬、王威、王亮等研究人员提出不规则卷积神经网络:可动态提升内核效率

近年来,卷积神经网络(CNN)在学界和业界广受欢迎,已被成功地应用到各种特征提取的任务当中。CNN的效果相较于前有很大提升,对各种任务的实用性都非常的强,但尽管如此,经典CNN仍存在一些问题值得探讨和深究。

图1 规则与不规则卷积核的对比。 (a) 不规则输入特征,其范围超越了3x3的区域 (b)两个3x3的卷积核,它们联合建模了输入特征 (c)从3x3卷积核到不规则卷积核的变形过程示例。

首先,卷积核的规则形状和不规则的特征模式并不匹配。在视觉任务中有一个重要的事实:虽然输入图像拥有矩形的形状且尺寸固定,但图像中的物体大多是形状不规则的——而这些物体才是研究中真正感兴趣的部分。以图像分类为例,常常需要的是给图像中的目标分类,而非图像本身。而这种情况在物体检测和分割中更加明显,因为这些任务的基本思想就是将不规则的目标从图像中分离出来。由于卷积运算本质上是两个向量的点积操作,即特征模式和卷积核,那么这两个向量在理想状态下应该具有相同的属性,这样才能获得更加准确的响应。也就是说,卷积核应该跟输入特征模式一样,也拥有不规则的形状,这样模型才能更好地提取最有价值的信息。而传统卷积神经网络的内核形状通常是固定的,不能通过训练来直接学习得到。 

相应地,形状的不匹配导致了规则卷积核在对不规则特征模式进行建模时效率低下。实际上,规则形状的卷积核也可以模拟不规则的特征模式,其基本思想是,在规则形状内不同尺度的权重分布可以具有与不规则形状相类似的效果。如图1 (b)所示,两个规则卷积核K1和K2都因为其特殊的分布,而拥有了建模不规则形状的能力。但这种方式消耗了18个权重参数去建模9个像素的输入特征。而且需要注意的是,如果输入特征更加细长或离散、如果卷积核更加离散(Dilated Convolution),这种低效的情况还会加剧。

解决方案

由于基本问题是规则卷积核与不规则输入特征的形状不匹配,那么最直观而合理的解决方案就是使卷积核的形状不规则且可训练。如图1 (c)所示,3x3的规则卷积核可以通过变形学习到一个新的不规则的形状。在变形的过程中,原本规则卷积核内的权重将会移动到新的位置来找到更有价值的特征信息。而移动的范围没有绝对限制,可以超出原先规则卷积核的范围。变形后,虽然权重数量不变,但不规则卷积核已经能够建模更加复杂的特征,而这个特征本应该被多个规则卷积核共同建模。      

图2 (a)规则卷积核各个权重的位置固定在一个矩形上 (b)不规则卷积核各权重的位置会随着训练而发生变化,损失函数梯度的反向传播会直接作用在不规则卷积核的形状变量上 (c) 位置浮动的双线性插值。

为了让卷积核拥有形变的能力,直接为其赋予可学习的权重位置变量(用以表征核的形状信息)。由于可导性的要求,位置变量必须满足连续性——用浮点小数表示。浮点小数的使用又自然地将插值操作应用进来,进而成功地建立起了用小数表示的形变位置、用整数表示的原始位置、输入特征和输出特征这四者的函数关系,最终使权重位置变量获得可学习的能力。

训练结果示意

为了更深刻地理解卷积核最后变成了什么形状,论文作者可视化了若干层的卷积核训练结果。实验使用Resnet101在pascal voc数据集上进行了语义分割训练。

图3 来自不同层的卷积核形状示意。(a)是最后一个卷积层fc1_voc12的卷积核,(c)是(a)在高-宽二维平面上的投影。(b)和(d)是另外相应层卷积核的二维投影。在这些图中,相同颜色的点意味着它们原本属于3x3矩形中的同一个位置。Px,Py代表高-宽平面,而channel代表输入数据流的通道数。

和原始规则卷积核比较:不规则卷积核的权重能够抽取多种不同尺寸和形状的信息。我们可以发现,原本属于同一位置的权重,在变形后大致拥有一个高斯分布的特性(即图中)。9个分布中心大致与规则形状时的原位置相同,但分布的伸展性保证了不同尺度的信息融合。不同层之间的卷积核比较:从子图(c)和另两张子图的比较中可以发现,越深的层,卷积核更加呈现出带状延伸。这种大幅的延伸方式使得较深的处理层能够更好地综合全局信息。

分割结果对应热度图展示

在语义分割任务中,对于一个特定的像素点来说,综合合适的图像信息对于分类结果的准确性非常重要。本实验中的热度图评估了,在对某一特定像素分类时,图像中各个位置对其分类结果的贡献值。红色贡献大,蓝色贡献小。

 图4 第一行,原始图像中使用红色十字标记的像素为最终的分类目标。以下两行热图表示的是对首行标记像素分类结果的贡献热度图,其中第二行代表使用规则卷积核的结果,第三行代表使用不规则卷积核的结果。图中黑色框框出的区域表示本不该被关注的干扰区,黄色框框出的区域表示应该关注的有价值的区域。

图4首先表明不规则卷积核可以更好地过滤掉分散注意力的干扰区。在第一列中,使用规则卷积核的传统卷积网络不可避免地加强了变化剧烈的梯子部分的响应,而ICNN却很好地过滤了这部分干扰。再者,它也表明不规则卷积核能够考虑更加全局的信息。如第三列所示,在对马脖子上标记像素进行分类时,除了附近的区域,不规则卷积网络还会加强对马头部和后腿部位的响应。而且稍微提升注意力观察,我们就能发现ICNN在对腹部、后腿、尾巴的响应更加精确。

总结

ICNN的目标在于建立起输入特征和卷积核的形态兼容,从而提升参数利用的效率。通过为卷积核添加形状属性,并使用双线性插值使其可以进行端到端的训练。这种改进可以在不添加任何子网络的情况下,平滑地集成到现有的卷积神经网络模型当中。

原文发布时间为:2017-09-15

时间: 2024-11-18 17:01:49

自动化所马佳彬、王威、王亮等研究人员提出不规则卷积神经网络:可动态提升内核效率的相关文章

爱考拉CEO王亮:如果你是听话的人,就不要出来创业

2014年5月25日,由IDG资本全资举办,创业邦协办的IDG校园创业大赛宣讲会第十一站在成都电子科技大学圆满落幕.本次校园创业大赛面向所有在校本科及研究生,旨在挖掘校园内的天才开发者和技术极客.爱考拉CEO王亮做了主题演讲,他从自己学生时代的经历讲起,谈了三个能让创业成功概率超过50%的条件:一是不听话,二是不服输,三是不妥协.另外,他还说:如果说你的理 想像一辆车,而你感觉一切都是在控制之中,那只能说明这一辆车开得还不够快."以下文字为王亮的演讲摘编,未经本人审阅:各位同学,各位老师大家好,

私募王亮:三网融合炒得牵强

本报记者黄娜报道 这段时间的股市可谓跌宕起伏,到底什么会是下一个市场的热点,针对这几天的表现记者发现 三网融合正成为一个新的投资亮点,随着三网融合的政策进一步明朗,游资也开始频频出击三网融合概念股票.就此,记者采访了深圳私募人士王亮. 王亮分析说,三网融合近期再起波澜,广电网络.天威视讯.中电广通.武汉塑料.电广传媒.歌华有线等相关能沾上边的个股都悉数上涨.可据他了解,三网融合的进展极其缓慢,各大利益集团之间的博弈是空前的,正所谓 "面和心不合". 他坦言,"最近有研究员提出

快钱王亮:合作共赢 创互联网金融时代

本文讲的是快钱王亮:合作共赢 创互联网金融时代,9月5日,2013中国国际金融展在北京展览馆盛大开幕.以"创新信息金融.服务社会民生"为主题,来自政府.银行.保险.科技等机构和企业参展.在当日上午的"第十四届中国金融发展"论坛上,快钱公司副总裁王亮从从业者对互联网金融的认知方面分享了他的看法. ▲快钱公司副总裁王亮 王亮认为一个市场化的经济,实际上是一个专业化的经济,随着市场化经济的发展,就是一个专业化无限细分的发展过程.银行或是互联网公司都应该坚持市场分工,团结一

Job36 CEO王亮:招聘网站细分化趋势明显

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 Job36行业招聘CEO王亮近日表示,招聘网站朝细分化.垂直行业化趋势将更加明显.在过去一年金融危机背景下,企业更加注重招聘效率,而垂直行业招聘网站能够快速对接行业人才流动,提供更精准高效的招聘服务. 王亮认为,招聘网站不断推陈出新,包括新业务及新模式的推出,力图解决严重的同质化弊端及提高求职招聘效率,这是行业主动创新的表现.而如何实现盈利是

前亚马逊中国总裁王汉华加盟好耶出任CEO职务

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 前亚马逊中国总裁王汉华(腾讯科技配图) 腾讯科技讯(乐天)11月19日消息,腾讯科技今日获悉,好耶集团已任命前亚马逊中国总裁王汉华博士为好耶集团首席执行官,全面负责好耶的战略和执行.该任命将于2012年12月1日正式生效.原好耶集团董事长兼临时CEO陈恂博士将继续担任集团董事长. 陈恂表示:"对于这样一位杰出的管理人才加入公司感到非

如何能让人眼前一“亮“:提升视觉效率

80.90后的记忆里都有一个游戏,叫做Where's Waldo? 如果你没有玩过也不要紧,Where's Waldo?是一个图画游戏,穿着红白条的Waldo隐藏在画面的某个角落,读者要用最快的速度找到他.正是因为Waldo的身影总是难以寻觅,大小朋友们才乐此不疲地寻找着他.但是,你有没有想过,为什么Waldo这么难找呢? 让我们先做一个实验.首先把你的手臂伸出,竖起大拇指,看着你的指甲盖,你所看到的部位大约占到整个视野的5%:这就是任意时刻你的目光焦点所能关注到的大小.虽然它只占整个视野的5%

[独家]平板电脑+Hulu视频 亚马逊内容为王

亚马逊最近动作连连,9月5日除了放出平板电脑销售的消息,让大家纷纷猜测亚马逊是在PK没有了乔布斯的苹果:而视频网站Hulu收购一事,也很有可能以亚马逊收归为最终结果.收编Hulu,更有利于亚马逊获得大量视频内容及销售客户.亚马逊此次大手笔大动作,显然是想抢占内容先机,一举成功. 亚马逊进军平板电脑 不为硬件为内容 9月5日消息,据国外媒体报道,亚马逊平板电脑细节已经泄漏,很显然,该零售商无意创造另外一个iPad.亚马逊谨慎的迈出第一步,通过一个7.7英寸的产品测试下市场反应.如果市场反应良好,将

金马奖花絮:王学圻再次缺席金马奖

王学圻(资料图) 新浪娱乐讯 第47届金马奖今晚(11月20日)在台北举行颁奖典礼.王学圻凭<十月围城>入选金马奖最佳男主角,并成为热门人选.不过遗憾的是,由于证件问题,王学圻最后还是未能登上飞往台湾的飞机.据其经纪公司工作人员表示,一直在机场等候的王学圻得知未能成行后直叹遗憾,并称不管今天是否拿奖,明年一定要去成台湾,去成金马奖. 王学圻去年凭<梅兰芳>获得金马奖最佳男配角奖,不过由于证件问题,他未能赶往台湾领取奖项.今年,王学圻则凭<十月围城>入选金马奖最佳男主角,

王军民副省长要求山东联通以差异化服务提升社会价值

王玉君 本报讯 (记者 王玉君) 近日,中共山东省委常委.副省长王军民到山东联通视察,他要求山东联通继续发挥信息化先导优势,以差异化服务提升企业社会价值,为山东经济建设再立新功. 王军民指出,山东联通着眼于满足全省地方经济发展和社会各行各业的信息化需求,积极探索,有效引导,在全省范围内深入推进包括政务信息化.农村信息化.企业信息化.社区信息化.家庭信息化以及宽带通信网建设在内的信息化"5+1"工程,积极推动全省政务网建设,搭建了覆盖全省的"商务新动力"."