Facebook介绍ICCV2017收录论文,其中五分之一都有何恺明的名字

本文讲的是Facebook介绍ICCV2017收录论文,其中五分之一都有何恺明的名字,


本周,全球的计算机视觉专家们即将齐聚威尼斯参加 ICCV (International Conference on Computer Vision)2017,展示计算机视觉和相关领域的最新研究进展。ICCV由IEEE主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议。CVPR每年召开一次,而ECCV和ICCV在世界范围内每年间隔召开。ICCV论文录用率很低,也符合它顶级会议的地位。

今年ICCV中,Facebook有15篇论文被收录,同时Facebook的研究员们也会参与多个workshop和tutotial。总体情况而言,ICCV 2017 共收到2143篇论文投稿,其中621篇被选为大会论文,录用比例29%。下面是Facebook此次收录的论文列表,按照不同的研究主题分组。(雷锋网 AI 科技评论发现,何恺明有多达三篇论文被收录;而谷歌的李飞飞也参与了一篇Facebook的论文)

语义和图像分割

Mask R-CNN

  • 作者:何恺明,Georgia Gkioxari, Piotr Dollar, Ross Girshick
  • 论文简介:这篇论文介绍了一个新型系统,它可以预测图像中的每一个像素属于哪一类中的哪一个物体。也就是说,这个系统不仅可以勾画出图中羊的轮廓并告诉你它们是羊(这一步属于语义分割),同时还能告诉你图像中的哪些部分对应着哪一只羊(实例分割)。Mask R-CNN是最早成功达到这类目标的系统之一。Facebook CTO Mike Schroepfer今年早些时候就在 F8 的主题演讲中展示了几个Mask R-CNN的应用例子。
  • 雷锋网 AI 科技评论之前写过这篇论文的解析文章,参见 Mask R-CNN实例分割通用框架,检测,分割和特征点定位一次搞定

Predicting Deeper into the Future of Semantic Segmentation

  • 向着语义分割的未来做更深远的预测
  • 作者:Pauline Luc, Natalia Neverova, Camille Couprie, Jakob Verbeek, Yann LeCun
  • 论文简介:这篇论文中,作者们开发了一个深度学习模型,它可以从给定的一帧来自视频的画面尝试预测下一帧会发生什么。换句话说,它在尝试猜测视频中的未来会如何。这篇论文表明,得到的模型可以提升计算机视觉系统在语义分割之类的任务中的表现。

Segmentation-Aware Convolutional Networks Using Local Attention Masks

  • 运用局部注意力遮罩的分割敏感的卷积网络
  • 作者:Adam W. Harley, Konstantinos G. Derpanis, Iasonas Kokkinos
  • 论文简介:随着卷积层不断向后推进,卷积神经网络中的单个神经元要观察的图像区域也越来越大。这会带来局部性非常差、并且模糊的响应,就是因为神经元要观察的图像范围太大了。在这篇论文中,作者们让每个神经元只关注部分感兴趣的区域,从而让神经元的响应变得更明确。

Dense and Low-Rank Gaussian CRFs Using Deep Embeddings

  • 使用深度嵌入的密集、低排序高斯CRF算法
  • 作者:Siddhartha Chandra, Nicolas Usunier, Iasonas Kokkinos
  • 论文简介:虽然卷积神经网络可以准确地把图像中的像素分为不同的类别(比如汽车,飞机等等),但临近区域的分类结果却经常不一致,一个物体的一半可能会被识别为“床”,另一半则可能被识别为“沙发”。这篇论文提出了一种方法,连接了所有像素的分类结果,形成连续一致的预测结果,同时还保持了很高的效率。

物体识别

Focal Loss for Dense Object Detection

  • 密集物体检测中的焦距损失
  • 作者:Tsung-Yi Lin, Priya Goyal, Ross Girshick, 何恺明, Piotr Dollár
  • 论文简介:这篇论文中介绍了一个用于物体识别的新系统。它和现有顶尖的物体识别方案采用了不同的技术路径。目前多数其它系统都由多个阶段组成,每个阶段都由不同的模型实现,这篇论文中设计了一个模型在一个阶段中解决整个物体识别问题。这种方法的简单性极其诱人,因为这让这个系统的实现和使用都简单了许多。
  • 雷锋网 AI 科技评论之前写过这篇论文的解析文章,参见 两届CVPR最佳论文得主何恺明新作:应对样本的不平衡分布,刷新密集物体检测表现上限

Low-shot Visual Recognition by Shrinking and Hallucinating Features

  • 通过缩放和变幻进行小样本视觉识别
  • 作者:Bharath Hariharan, Ross Girshick
  • 论文简介:一般来说,物体检测系统都要先用需要识别物体的照片进行训练,每个类别都需要数以千计的照片。这篇论文针对的问题是如何在仅仅看过一种新物体的很少几张样本后就能对它进行识别。它使用的方法是产生更多的要学习的物体的样本(缩放和变幻)。

Transitive Invariance for Self-supervised Visual Representation Learning

  • 具有变换不变性的自我监督视觉表征识别
  • 作者:Xiaolong Wang, 何恺明, Abhinav Gupta
  • 论文简介:这篇论文的目标是为物体检测学习更好的模型,途径是观察视频中的物体外观如何变化。比如,视频中一辆汽车开过,在不同的帧中展示了汽车不同的侧面。由于已知视频中的每一帧都展示的是同一辆车,用这些信息学习的模型就可以更好地理解同一个物体在不同视角下的样子。然后就可以用得到的模型改善物体检测的效果。

图像分类

Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization

  • Grad-CAM:通过基于梯度的本地化展示深度网络的视觉解释
  • 作者:Ramprasaath R. Selvaraju, Michael Cogswell, Abhishek Das, Ramakrishna Vedantam, Devi Parikh, Dhruv Batra
  • 论文简介:多数现代图像分类系统都基于卷积神经网络的结构。这些网络的表现当然很不错,但是它们也还在很大程度上是“黑盒子”。这篇论文介绍了一种新的方法可以揭开这个黑盒子,把图片中能够让系统识别出结果的区域用特定的方式进行可视化。

Learning Visual N-Grams from Web Data

  • 从网络数据学习视觉N维信息
  • 作者:Ang Li, Allan Jabri, Armand Joulin, Laurens van der Maaten
  • 论文简介:多数图像识别系统都是用人工标注的大规模图像数据库训练的,当中这个标注过程又枯燥又无法扩展。这篇论文中开发了一个图像识别系统,它是用5千万张图像和对应的用户评论训练的,不需要人工标注。这个系统可以识别物体、地标,以及数个单词长的场景,比如“金门大桥”或者“自由女神像”。

视觉和语言综合应用

Inferring and Executing Programs for Visual Reasoning

  • 用于视觉推理的推断和执行程序
  • 作者:Justin Johnson, Bharath Hariharan, Laurens van der Maaten, Judy Hoffman, 李飞飞, C. Lawrence Zitnick, Ross Girshick
  • 论文简介:这篇论文讨论了这样一个视觉推理任务:给定一张图像,要让模型回答“绿色盒子前面的那个东西是什么形状?”模型的工作方式是使用一个“模块化网络”,这个网络会把问题转换成一个简单的计算机程序,然后用神经网络实现其中的每一个指令。这篇论文还展示了一个新的数据集用于视觉推理,名为“CLEVR-Humans”

Learning Cooperative Visual Dialog Agents with Deep Reinforcement Learning

  • 用深度强化学习训练合作视觉对话机器人
  • 作者:Abhishek Das, Satwik Kottur, Jos. M. F. Moura, Stefan Lee, Dhruv Batra
  • 论文简介:这篇论文中,作者们开发了一个聊天机器人,它能回答关于图像的问题。你可以问它“那个女人的伞是什么颜色的”这样的问题。如果图像中有两个女人,这个聊天机器人会问你:“哪个女人?”你答复它:“黑色头发的那个”,然后聊天机器人会告诉你:“伞是蓝色的。”离真正解决这类问题还有很远的距离,但这是这个领域的首项研究,对这个问题做出努力。

Learning to Reason: End-to-End Module Networks for Visual Question Answering

  • 学习推理:用于视觉问题回答的端到端模型网络
  • 作者:Ronghang Hu, Jacob Andreas, Marcus Rohrbach, Trevor Darrell, Kate Saenko
  • 论文简介:这篇论文介绍了一种用于回答“紫色的圆柱体左侧的球是什么颜色”这类问题的新方法。在新方法中,问题会首先被转换为一个小型计算机程序;然后程序中的每个指令都会由一个神经网络来执行。程序生成器和程序执行器都是从成对的图像和问题中学习的。

Speaking the Same Language: Matching Machine to Human Captions by Adversarial Training

  • 讲一样的话:通过对抗性训练让机器符合人类生成的标题
  • 作者:Rakshith Shetty, Marcus Rohrbach, Lisa Anne Hendricks, Mario Fritz, Bernt Schiele
  • 论文简介:这篇论文要处理的问题是图像标题的自动生成,也就是说,用自然语言描述一副图像。主要的技术创新是,它尝试让系统生成的标题更像是人类生成的。

图像生成

Unsupervised Creation of Parameterized Avatars

  • 无监督创作参数化漫画照片
  • 作者:Lior Wolf, Yaniv Taigman, Adam Polyak
  • 论文简介:这篇论文中开发了一个新的系统,它可以基于一张正常的脸部照片,生成一个看起来很像你的漫画照片。主要的技术创新是,系统是以一种无监督的方法训练的。这意味着它并不是用成对的脸部照片和对应的漫画照片训练的,它拿到的只有整整一组人脸照片和另一组漫画的照片。系统会自动学习如何找到人脸照片和漫画照片之间的对应关系。

3D视觉

Deltille Grids for Geometric Camera Calibration

  • 用于几何相机矫正的Deltille网格
  • 作者:Hyowon Ha, Michal Perdoch, Hatem Alismail, In So Kweon, Yaser Sheikh
  • 论文简介:物体的三维模型在很多场景下都会用到,比如虚拟显示VR中。在一个圆顶一样的空间内布置上百个相机,让它们同时拍一张照片,就可以建立出一个三维模型。这些相机都需要先进行校准,这样如果系统知道所有相机的确切位置,它就可以把所有的照片都进行合并,生成这个物体的三维模型。在过去的几十年中,相机的校准工作都是通过拍一张标准标定板完成的。这篇文章中的成果表明,如果拍摄一张带有三角形区域的标定板,相机可以被校准得更加准确。

论文下载

为了方便国内的小伙伴们阅读,我们已经把这15篇论文从Facebook官网搬运并打包,下载地址 https://pan.baidu.com/s/1missH9e 

其它ICCV活动

除了以上的收录论文外,Facebook还会参加以下的多个Tutorial和Workshop

  • Instance-Level Visual Recognition Tutorial(何恺明会去这个,有同学想要去现场堵他的吗?)
  • Closing the Loop between Vision and Language Workshop
  • Generative Adversarial Networks tutorial
  • Role of Simulation in Computer Vision workshop
  • Workshop on Web-Scale Vision and Social Media
  • Workshop on Computer Vision for Virtual Reality
  • COCO + Places Workshop
  • PoseTrack Challenge Workshop






本文作者:杨晓凡

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-07-29 05:21:47

Facebook介绍ICCV2017收录论文,其中五分之一都有何恺明的名字的相关文章

【ICCV 2017华人雄起】何恺明包揽两项最佳论文,40%投稿来自中国

计算机视觉顶会ICCV 2017各大奖项公布:何恺明包揽两项最佳论文奖:贾扬清率Caffe团队获"无私贡献奖":DeepMind CEO 哈萨比斯导师Tomaso Poggio获得终身成就奖.沿袭CVPR的势头,ICCV 2017华人表现依然强劲,有40%的投稿来自中国,清华大学投稿数量在所有机构中位居第一. 两年一度的计算机视觉领域顶会ICCV 2017正在意大利威尼斯召开.由于计算机视觉及相关领域的快速发展,本届ICCV参与度创历史新高,共收到2143篇论文投稿,比上届增加了26%

两届CVPR最佳论文得主何恺明新作:应对样本的不平衡分布,刷新密集物体检测表现上限

雷锋网 AI 科技评论按:CV大牛何恺明在Facebook人工智能实验室的新作,一起来围观! 何恺明博士,2007年清华大学毕业之后开始在微软亚洲研究院(MSRA)实习,2011年香港中文大学博士毕业后正式加入MSRA,目前在Facebook人工智能实验室(FAIR)实验室担任研究科学家.何恺明博士最让人印象深刻的是曾两次以第一作者身份摘得CVPR最佳论文奖(2009和2016),其中2016年CVPR最佳论文为图像识别中的深度残差学习(Deep Residual Learning for Im

不仅是白金赞助商,谷歌更是ICML 2017 的重量级参与者(附59篇收录论文下载) | ICML 2017

雷锋网 AI 科技评论按:机器学习领域顶级会议 ICML 2017 已经开始了,雷锋网(公众号:雷锋网)记者会带来全方位的大会报道. 在之前的文章中,雷锋网 AI 科技评论就介绍过434篇 ICML 收录论文中有多达44篇都出现了谷歌的名字,谷歌的在机器学习领域的投入与成果之多可见一斑.今天谷歌也正式给出了自己的收录论文名单,署名的谷歌的就有42篇,其中有4篇是在几个 workshop 中.根据我们前两天的报道,署名DeepMind的收录论文也有25篇之多.那么来自谷歌的全部论文就有65篇(其中

【前沿】何恺明大神ICCV2017最佳论文Mask R-CNN的Keras/TensorFlow/Pytorch 代码实现

我们提出了一个概念上简单.灵活和通用的用于目标实例分割(object instance segmentation)的框架.我们的方法能够有效地检测图像中的目标,同时还能为每个实例生成一个高质量的分割掩码(segmentation mask).这个方面被称为 Mask R-CNN,是在 Faster R-CNN 上的扩展--在其已有的用于边界框识别的分支上添加了一个并行的用于预测目标掩码的分支.Mask R-CNN 的训练很简单,仅比 Faster R-CNN 多一点计算开销,运行速度为 5 fp

Lucene.Net 2.3.1开发介绍 —— 三、索引(五)

原文:Lucene.Net 2.3.1开发介绍 -- 三.索引(五) 话接上篇,继续来说权重对排序的影响.从上面的4个测试,只能说是有个直观的理解了."哦,是!调整权重是能影响排序了,但是好像没办法来分析到底怎么调啊!".似乎是这样,现在需要把问题放大,加大索引的内容.到博客园新闻区,用zzk找了4篇内容包含"测试"的文章.代码变成 2.1.5 代码2.1.5  1using System;  2using System.Collections.Generic;  

旅游电商已占据中国旅游集团20强榜单五分之一席位

旅游集团是企业集团的一种特殊类型,由两个以上满足旅游者相关需求的企业构成.从国际经验来看,旅游集团表现为以产权为基础性的联结纽带,并能够在投融资.计划财务.产品研发.市场营销.品牌培育.人力资源等商业活动中保持密切联系,并能够为了集团的总体战略目标而协调行动的企业联合体.旅游集团是旅游产业先进生产力的代表,在旅游业的发展中起着核心和主导的作用,其变动情况在很大程度上表征了我国旅游产业的发展趋势. 旅游集团企业的排名的倡议来源于2009年首届中国旅游发展论坛,根据参会企业的倡议,为把研究成果更好地

Lucene.Net 2.3.1开发介绍 —— 二、分词(五)

原文:Lucene.Net 2.3.1开发介绍 -- 二.分词(五) 2.1.3 二元分词   上一节通过变换查询表达式满足了需求,但是在实际应用中,如果那样查询,会出现另外一个问题,因为,那样搜索,是只要出现这个字,不管它出现在什么位置.这就产生了上一小节开头讲的,对准确性产生了极大干扰.比如,如果有一段这样的话:"这是一个英雄!他有无法用词汇形容的孤单,但是他并没有用言语来表达."这句话包含了"英 语 单 词"这四个字,但是却和"英语单词"一

【何恺明最新论文】非局部神经网络,打造未来神经网络基本组件

大神 Kaiming He 日前在 arXiv 上新挂出来一篇论文,标题延续了一贯的简洁风格,叫做<非局部神经网络>(Non-local Neural Networks). 这是一篇 CMU 与 FAIR 合作的论文,第一作者是 CMU 的 Xiaolong Wang,其他两位作者是 Ross Girshick(DenseNet 作者之一)和 Abhinav Gupta(CMU 教授,他今年 CVPR + ICCV 一共发表了 15 篇论文). 摘要 卷积和递归运算都是一次处理一个局部邻域的基

周博磊知乎热答:如何评价何恺明大神斩获ICCV 2017最佳论文

2017年10月24日下午,Facebook AI 研究员何恺明大神斩获ICCV 2017最佳论文,这是他第三次斩获顶会最佳论文,对于Kaiming He 在 ICCV 2017 上拿下双 Best的paper,他的中大同学,另一位大神周博磊在知乎写了一段他眼中的凯明师兄. 大数据文摘经周博磊授权,发布这篇文章,看看大神眼中的大神是什么样? 其实从他发Dark Channel那篇论文开始,我就挺关注他的研究工作.那时候还是前Deep Learning时代的计算机视觉,一切都还不怎么work,还流