【超越200层ResNet】颜水成团队 CVPR 新架构,提速300%

本文意在为您简要解读最近在 arXiv 上一篇最新的文章 《双通道网络》(Dual Path Networks),原作者已经将源码公开到了 GitHub。

在论文中,作者分析并证明了 ResNet 与 DenseNet 之间的重要联系:Densely Connected Network Family 里包含 Residual Network Family。作者分析了两者各自的优缺点,并基于分析所得结论,提出了一类新的网络拓补结构:双通道网络(Dual Path Network Family)。

论文地址:https://arxiv.org/pdf/1707.01629.pdf

ResNet 实际属于 DenseNet

DenseNet 是由[1] 提出的一类不同于 ResNet 的网络结构。ResNet 将输出与输入相加,形成一个残差结构;而 DenseNet 却是将输出与输入相并联——相并联,相并联(重要的事情说 3 遍),实现每一层都能直接得到之前所有层的输出。

下图中, (a/b) 展示了两种网络。请注意两者的区别,将 DenseNet 理解为一种有很多残差连接的 ResNet 是非常错误的理解。

文中作者发现,Residual Networks 其实就是 Densely Connected Networks 的一种特例。这里我们通过分析网络结构简要证明下:

上图中,假设实线箭头代表一次变换(本例中指含激活函数的卷积),若 (b) 中绿色箭头代表的函数相同,那么我们就可以通过添加一个残差通道(residual path)保留中间计算结果,将其化简为 (c)。而 (c) 的形式恰恰就是一个残差网络的形式(棕色点线)。

也就是说,一个 DenseNet 可以通过共享参数的方式,退化为 ResNet。ResNet 实际上就是 DenseNet 在跨层参数共享时候的特例

本文认为:

1)ResNet 通过这种跨层参数共享和保留中间特征的方式,可以有效的降低特征上冗余度,重复利用已有特征,但缺点在于难以利用高层信息再发掘底层特征;

2)DenseNet 每一层都重新在之前所有层的输出中重新提取有用信息,可以有效地利用高层信息再次发掘底层新特征,但其却存在特征上的冗余。

双通路网络 DPN:结合残差网络和 Densenet 两者优点

那么,一个很自然的想法就是结合这两类网络拓补结构,实现优缺点互补。于是,文章提出了一类全新的双通道网络结构:Dual Path Network(DPNs)。

DPN 具体网络结构

需要注意的是,与 Residual Network Family 和 Densely Connected Network Family一样,Dual Path Network Family 也将存在诸多变种,其内部链接并不局限于下图中的 “1x1->3x3->1x1” 这种形式。

其核心思想是,将残差通道和 densely connected path 相融合,实现优缺互补,其重点不在于细节部分是如何设定的。

上图中,(e) 以 (d) 为例,展示了实际使用中的一种 DPN。简单来讲,就是基于现有的残差网络,将最后的 1x1 输出切分为两路,一路加到 residual path 上去,一路并到 densely connected path 上去。(这里请注意与 PyramidNets [2] 的本质区别。)

本文分别在“图像分类”,“物体检测”和“物体分割”三大任务上对 DPN 进行了验证。在 ImageNet 1000 类分类任务中的性能如表 2 所示:

注意,这里的FLOPs是理论值,实际效率不同于理论值。MXNet 在 concat layer 和 split layer 那里还有待对 DPN 进行特殊优化,减少不必要的内存拷贝等操作。

但即便如此,在实测中: DPN-98 也显著提高了训练速度,降低内存占用,并保持更高的准确率。即便是最佳单模型 DPN-131 也并没有增加很多计算量和内存开销,完全可以直接作为其他任务的基础网络来使用。相较之前的最佳单模型 Very Deep PolyNet,DPN-131 实际训练速度提升约 300%。

下图给出了在单节点,4 块 K80(K80 为双GPU)下的实测结果:

DPN 在 PASCAL VOC 上的“物体检测”和“物体分割”对比实验结果如下表所示:

篇幅所限,感兴趣的老师同学请查看原文。

总结

构建高性能、低资源占用的网络结构一直是深度学习里一个重要的研究方向。正如残差网络 (ResNet) 所展现的,一个有效的网络拓补结构,不仅能全面提高“图像识别”任务中准确性,更能通过直接替换底层网络的方式受益“图像生成”、“检测”、“分割”、“美化”等等诸多应用。

在 DPN 这篇文章中,作者分析探讨了现在最受欢迎的两种网络结构,并提出了其独特的见解:认为 ResNet 是 DenseNet 在参数跨层共享时的特例。基于这一结论,作者进一步提出了一类高性能、低资源占用的全新网络拓补结构 Dual Path Networks,DPN 有效地融合了现有网络,实现了优势互补,其性能在“图像识别”、“图像检测”和“图像分割”这三大任务中均得到了验证,各项指标得到了显著提升。相信近期将能在更多的工作和报道中看到双通道网络的身影。

文章转自新智元公众号,原文链接

时间: 2024-10-21 13:35:15

【超越200层ResNet】颜水成团队 CVPR 新架构,提速300%的相关文章

360副总裁颜水成博士:技术与产品并重,1×1卷积让深度学习更出彩 | CCF-GAIR 2017

7 月 7 日,由中国计算机学会(CCF)主办,雷锋网与香港中文大学(深圳)承办的CCF-GAIR 2017全球人工智能与机器人峰会在深圳大中华喜来登酒店如期开幕.奇虎360副总裁.首席科学家.IEEE Fellow.IAPR Fellow颜水成博士带来了主题为<深度学习:精度极限VS用户体验>的演讲.这是大会首日最后一场演讲. 作为360 人工智能研究院院长,颜水成博士曾在新加坡国立大学领导机器学习与计算机视觉实验室,他的主要研究领域是计算机视觉.机器学习与多媒体分析,其团队提出的"

AIR 025 | 360 首席科学家颜水成:有关机器视觉的六个洞见

    从飞鸟到飞机,从蝙蝠到雷达.人类对自然界的每一次致敬都能把自己带入一个新时代.而人工智能,恰恰是向自然界的王者--人类--致敬. 自从有计算机那天开始,人们就从未中断让机器拥有智慧的梦想.在这条路上,有一位广受世界学界尊重的大师,他就是来自 360 的首席科学家.国际知名计算机视觉与深度学习专家颜水成. 他不仅在国际上领域数次引领了计算机视觉的研究方向,还进行了大量前瞻的实践,让计算机模仿婴儿大脑的运作方式,一步步观察学习这个世界. 在 2016 CCF-GAIR 全球人工智能与机器人峰

class-j2ee问题,sevice层能不能弄成单一的一个类

问题描述 j2ee问题,sevice层能不能弄成单一的一个类 该类来判断跟处理请求的所有action,调用相应的dao,我担心会不会所有的请求都要经过这个类,导致该类负担太大系统崩溃 我是查询的时候弄成这样一个类,如果是说怕维护麻烦到是不怕 接口: /****** * @描述:根据不同请求进行相应的查询业务处理 * @param action 请求Action * @param params 参数集合 * @param page 页数 * @param rp 分页条数 * @param sort

“师兄帮帮忙”团队最近新创了一家公司

摘要: 师兄帮帮忙吧! 好呀,帮什么? 我想借点钱 pia!滚粗! ...再好的师兄,也无法拯救你的金钱问题.但是师兄做不了的事,一家互联网金融公司却能做到.是的,11年开始火爆校园 "师兄帮帮忙吧!" "好呀,帮什么?" "我想借点钱" "pia!滚粗!" ...再好的师兄,也无法拯救你的金钱问题.但是师兄做不了的事,一家互联网金融公司却能做到.是的,11年开始火爆校园的"师兄帮帮忙"团队最近新创了一家公

政府为资本找项目 PE/VC或成温州民资新时尚

资本总是逐利的,对市场极为敏感的浙江尤其是温州民间资本的动向一直被人关注. 那么,当海外市场风险加大,实体经济前景不明,股市楼市同时处于熊市中之时,善于逐利的在浙江民间资本中最有代表性的温州民间资本的走向备受关注.温州民间资本仍在彷徨中观望吗?它的最新去向是哪里? 被过滤广告 上月底,有着官方背景的民资服务中心的挂牌似乎昭示着这些隐秘资本的新去向."现在玩PE(私募股权投资)/VC(风险投资)似乎成为了温州民资的新时尚."拥有两家企业,身处投资最前沿的周先生表示,"不过,民间

MetaLabs发布了一款面向团队的新产品 Peak

最近 MetaLabs 既 Flow 之后正式对外发布了一款面向团队的新产品 Peak,看着挺吸引人,所以准备去玩玩看.不过当我进入注册页面后,我犹豫了,相对冗长的信息填写,还要求信用卡信息,再回去看看定价方案,必须年费支付,思考了一会,最后打了退堂鼓.我们做产品的都会有一个共识,尽可能的降低用户的进入门槛,减少注册路径,让用户能尽快的了解产品的特色.而这里 Peak 是反其道而行之,我相信跟我一样因为犹豫最后放弃了的访问会不在少数.但是细细思考后,这种验证 MVP 的方法真好! 精益创业的核心

OPhone成TD终端新战场

C114讯 12月15日上午消息(桑菊) 继LG首款TD版OPhone GW880开始销售后,又一款TD版 OPhone--联想O1手机正式开卖.相关资费政策显示,联想O1的裸机零售价为4999元,但用户只需承诺在网两年,月消费208元即可获得联想O1一台. 联想推出O1 展讯提供芯片 针对联通版iPhone的推出,中国移动也推出了搭载自主研发的OMS系统的OPhone手机.昨天,移动推出的TD版本的OPhone联想O1手机正式上市,该款手机售价4999元,但用户只需承诺在网两年,月消费208元

上市公司涌入融资租赁成扭转业绩新途径

本报讯摩恩电气.万里扬.亚夏汽车.和佳股份昨日同时发布有关融资租赁的公告,称旗下的全资子公司获得内资融资租赁试点企业资格.再加上越老越多的公司参与融资租赁业务,上市公司正在涌入融资租赁市场. 融资租赁获政策支持 商 务部本周二发布了第11批.25家公司的内资融资租赁试点企业名单,包括摩恩电气.万里扬.亚夏汽车.和佳股份.这是商务部今年来批准的第二批试点企业, 数量超越年初第10批的19家,创下历史新高.至此,参与试点的企业总数过百,达到123家.近几年,中国融资租赁业发展迅速,公司总数现已突破7

双11过后 普惠科技成阿里集团新关注点

本文讲的是双11过后 普惠科技成阿里集团新关注点[IT168 云计算]随着2016年天猫双11全球狂欢节落下帷幕,备受关注的阿里云不仅完美支撑了双11整个交易流程系统的平稳运行,并在自身销售业绩上交出了一份满意答卷:截止11月11日24时,阿里云双11全天销售收入超过1.9亿元,相当于24小时卖空一座超大规模的数据中心,为数万家企业节省超过11亿元的IT成本.而这一切都要归功于阿里云7年来积攒的庞大规模优势与持续的技术迭代. 7年磨砺 释放云端红利 今年10月,阿里云在云栖大会上就曾集中对外宣布