CVPR2017:深度纹理编码网络 (Deep TEN: Texture Encoding Network)

这是一篇CVPR2017的投稿 (ArXiv的链接:https://arxiv.org/pdf/1612.02844v1.pdf),已被CVPR2017接收。在这里给大家介绍一下这部分的工作,不像写论文那样用词严谨,这里简单介绍一下核心思想,方便大家阅读。(我个人是来到美国之后才接触科研,文中学术名词的汉语表述有不当之处还请谅解。)

我们提出了一个新的深度学习模型,这个模型推广了传统的字典学习 (dictionary learning) 和残差编码 (Residual Encoders),比如 VLAD 和 Fisher Vector。提出的编码层 (Encoding Layer) 和已有的深度学习结构兼容,实现了端对端的材料识别 (End-to-end),并且取得了不错的效果。

这个方法主要是受到传统方法的启发:对于输入的图片,我们通常先提取图像特征(比如SIFT 或者是 filterbank responses),之后一个字典可以通过非监督式的聚类得到,这样我们可以对已有的图片特征进行编码(材料识别中通常使用一些无序的编码器,比如BoWs,VLAD),并使用分类器进行分类。传统方法有以下两个特点:1. 输入图片可以为任意大小,编码器可以转化为一个固定长度的表达。2. 特征本身是通用的(domain-independent),字典和编码表达通常挟带了域信息(domain-specific information)。

受到传统方法的启发(左图),Cimpoiet. al. CVPR 2015 使用了预训练的神经网络的卷积层提取了深度特征,并且使用了 Fisher Vector 编码器,刷新了当时的state-of-the-art(中图)。但是这种方法仍然有局限性,因为它包含了许多分步的优化,这样特征提取(卷积层),字典学习和编码器不能够从标识的数据(labeled data)中得到进一步优化。理想的方法是如右图,将整个字典学习和编码整合到一个CNN网络层中,使它与已有的深度学习体系兼容,这样以来就实现了端对端的学习优化。

方法部分有一些tricky,我们主要是提出了个数学模型 (Residual Encoding Model),推广了已有的编码器 (VLAD, Fisher Vector),并且使得整个系统是可微分的,这样我们就可以像已有的深度学习层一样,从loss function中学习到参数。也就是说它实现了监督式的字典学习(supervised dictionary learning)。这个模型有很多特性,它使得CNN网络可以接受任意大小的图片,并且因为字典学习和表达容易携带Domain信息,这样学习到的深度特征就更加容易应用于其他domain。

这个模型有很多可以应用的地方,除了文中提到的材料/纹理识别以外,因为它推广了VLAD和Fisher Vector,那么可以期待它在Robust Recognition中的应用前景(比如场景识别scene understanding),还有图像检索(image retrieval) 等等。欢迎大家多关注我的工作,而且我们提供基于Torch的代码(https://github.com/zhanghang1989/Deep-Encoding)。我个人现在在做visualize 和 inverse 这个编码网络,欢迎多交流 (RemoveThisifYouAreHuman~zhang.hang@rutgers.edu)。

这篇文章实现了之前很多paper想要努力却未能实现的目标——将Fisher Vector和CNN一起训练,包括 VLAD-CNN (Gong et al. 2014), FV-CNN (Cimpoi CVPR 2015), Bilinear CNN (Lin ICCV 2015) and NetVLAD (CVPR 2016) 甚至早期的 Deep Fisher Network (Simonyan et al. 2013)。很多人不了解本文和NetVLAD的区别,其实NetVLAD回避了反向传播梯度推倒的困难,直接将问题过于简化为CNN已有的模型,这一简化其实改变了残差编码(residual encoder)的特性。

原文发布时间为:2017-06-17

本文作者:张航

时间: 2024-09-28 17:50:02

CVPR2017:深度纹理编码网络 (Deep TEN: Texture Encoding Network)的相关文章

秒懂!何凯明的深度残差网络PPT是这样的|ICML2016 tutorial

联合编译:Blake.高斐 雷锋网注:何凯明博士,2007年清华大学毕业之后开始在微软亚洲研究院(MSRA)实习,2011年香港中文大学博士毕业后正式加入MSRA,目前在Facebook AI Research (FAIR)实验室担任研究科学家.曾以第一作者身份拿过两次CVPR最佳论文奖(2009和2016)--其中2016年CVPR最佳论文为图像识别中的深度残差学习(Deep Residual Learning for Image Recognition),本文为何凯明博士在ICML2016上

深度学习网络大杀器之Dropout(II)——将丢弃学习视为集成学习之我见

首发地址:https://yq.aliyun.com/articles/110002 更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud 关于dropout的分析,可以见博主的另外一篇文章: <深度学习网络大杀器之Dropout--深入解析Dropout> 1.引言 随着2012年Hiton的文章<ImageNet classification with deep convolutional neural networks>[1]的问世,掀开了学

一文读懂深度适配网络(DAN)

这周五下午约见了机器学习和迁移学习大牛.清华大学的龙明盛老师.老师为人非常nice,思维敏捷,非常健谈!一不留神就谈了1个多小时,意犹未尽,学到了很多东西!龙明盛老师在博士期间(去年博士毕业)发表的文章几乎全部是A类顶会,他在学期间与世界知名学者杨强.Philip S. Yu及Michael I. Jordan多次合作,让我非常膜拜!这次介绍他在ICML-15上提出的深度适配网络. 深度适配网络(Deep Adaptation Netowrk,DAN)是清华大学龙明盛提出来的深度迁移学习方法,最

台湾大学黄意尧:深度残差网络下的弱监督关系抽取

在今年的 EMNLP 2017 上,台湾大学黄意尧与加州圣塔芭芭拉大学 (UCSB)William Wang 教授有一篇合作论文被录用.受雷锋网(公众号:雷锋网) AI 科技评论邀请,黄意尧撰写了关于这篇论文的研究历程,以供学习与参考.雷锋网 AI 科技评论做了不改动原意的编辑与修改,将繁体字转换为简体,并将一些台湾常用表述转换为大陆的通用说法. 论文名称:Deep Residual Learning for Weakly-Supervised Relation Extraction 论文地址:

JavaScript深度复制(deep clone)的实现方法_javascript技巧

在代码复用模式里面有一种叫做"复制属性模式"(copying properties pattern).谈到代码复用的时候,很有可能想到的是代码的继承性(inheritance),但重要的是要记住其最终目标--我们要复用代码.继承性只是实现代码复用的一种手段,而不是唯一的方法.复制属性也是一种复用模式,它跟继承性是有所不同的.这种模式中,对象将从另外一个在对象中获取成员,其方法是仅需将其复制即可.用过jQuery的都知道,它有一个$.extend()方法,它的用途除了扩展第三方插件之外,

深度学习网络大杀器之Dropout——深入解析Dropout

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud 过拟合是深度神经网(DNN)中的一个常见问题:模型只学会在训练集上分类,这些年提出的许多过拟合问题的解决方案:其中dropout具有简单性并取得良好的结果: Dropout 上图为Dropout的可视化表示,左边是应用Dropout之前的网络,右边是应用了Dropout的同一个网络. Dropout的思想是训练整体DNN,并平均整个集合的结果,而不是训练单个DNN.DNNs是以概率P舍弃部分神经元,其它神经元

实战经验分享一深度剖析网络推广方法

中介交易 SEO诊断 淘宝客 云主机 技术大厅 说起网络推广方法,每个网络从业人士随口都能说出好几种,网上一搜也一大堆.在中国几个著名的站长或电商平台,如Admin5.Chinaz.Paidai等网站,这类文章可谓多如牛毛.许多文章看了确实令人受益非浅,或者深受启发,但实际操作起来,还是感觉无从下手,一脸茫然.造成这种情况的原因主要是信息太分散,这里说一点,那边提一些,缺乏一个较为系统全面的完整教程;另外一方面就是很多文章是一些没有实战经验的"牛蛙"所写,想象大于实践,所谓牛蛙,就是看

文志:网络营销公司深度剖析网络社区

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 在很多年以前,大部分人把论坛说成了社区,就算是到了现在还是有很多人仍然分不清楚论坛与社区的区别,而且大家依然习惯将一个社区叫成一个论坛. 今天我将在这里全面讲解社区的意义,让大家对网上的社区有一个更加深入与全面的认识.首先我们要了解的是论坛仅仅只是构成社区的一个部分,是社区中大家公共活动和讨论的场所,也是社区组织活动与社区文化特征特色的平台.

深度讲解网络软文的写作技巧及投放技巧

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 目前很多企业都开始关注网络营销,而不管采用何种营销手法,都离不开文章的撰写,那么如何才能写出一篇好的软文呢?今天笔者就跟大家分享一些关于软文撰写的基本技巧及投放技巧. 1.一篇优秀的软文,标题是成功的关键 一篇文章能不能吸引读者关注,标题是非常关键的,特别是在一个页面上拥有成百上千的文章链接时,如果想让读者点击阅读,就取决于文章标题啦,在编写