【ICCV 2017华人雄起】何恺明包揽两项最佳论文,40%投稿来自中国

计算机视觉顶会ICCV 2017各大奖项公布:何恺明包揽两项最佳论文奖;贾扬清率Caffe团队获“无私贡献奖”;DeepMind CEO 哈萨比斯导师Tomaso Poggio获得终身成就奖。沿袭CVPR的势头,ICCV 2017华人表现依然强劲,有40%的投稿来自中国,清华大学投稿数量在所有机构中位居第一。

两年一度的计算机视觉领域顶会ICCV 2017正在意大利威尼斯召开。由于计算机视觉及相关领域的快速发展,本届ICCV参与度创历史新高,共收到2143篇论文投稿,比上届增加了26%。其中,621篇被接收,接收率约29%,与往届持平(ICCV 2015 收到 1698 篇投稿,录取率为30.3%)。

投稿数量统计:ICCV 中国崛起

在ICCV 2017的各种统计数字中,可能最引人瞩目的,是中国崛起。

根据投稿作者的邮箱地址,有844篇论文(将近40%)来自中国,美国以934篇位居第一。看投稿数量,中美两国也遥遥领先。

其中,投稿数量最多的机构是清华大学,超越了CMU,超越了谷歌,超越了MIT。上海交通大学和北航分别位列第八、第九。

新智元粗略统计,今年ICCV 接收论文中,有40%的第一作者都是华人。

虽然不尽是华人,我们也在本届大会主席团队中见到了熟悉的名字,本届ICCV的大会主席之一是微软亚洲研究院首席研究员池內克史。两位Workshop Chair,一位是微软的Sing Bing Kang,另一位是预定出任CVPR 2019 程序主席的上海科技大学&特拉华大学教授虞晶怡。

ICCV 2017 热词:新智元对ICCV 2017录用论文标题做了词频统计,“深度学习”、GAN、识别、检测依然是热词。

何恺明携 Mask R-CNN 获得 ICCV 2017最佳论文奖

作为与CVPR、ECCV齐名的计算机视觉三大顶级会议之一,ICCV的论文集代表了计算机视觉领域最新的发展方向和水平,也令ICCV 2017最佳论文尤其受到关注。

ICCV 2017的最佳论文奖(Marr prize)颁发给了Facebook AI实验室(FAIR)何恺明等人的论文《Mask R-CNN》。

ICCV 2017最佳论文颁发给了Mask R-CNN

论文标题非常简洁,就是“Mask R-CNN”:

摘要

我们提出一个概念上简单,灵活,通用的物体实例分割框架(object instance segmentation)。我们的方法能有效检测图像中的对象,同时为每个实例生成高质量的分割掩膜(segmentation mask)。我们将该方法称为 Mask R-CNN,是在 Faster R-CNN 上的扩展,即在用于边界框识别的现有分支上添加一个并行的用于预测对象掩膜(object mask)的分支。Mask R-CNN 的训练简单,仅比 Faster R-CNN 多一点系统开销,运行速度是 5 fps。此外,Mask R-CNN 很容易推广到其他任务,例如可以用于在同一个框架中判断人的姿势。

我们在 COCO 竞赛的3个任务上都得到最佳结果,包括实例分割,边界框对象检测,以及人物关键点检测。没有使用其他技巧,Mask R-CNN 在每个任务上都优于现有的单一模型,包括优于 COCO 2016 竞赛的获胜模型。我们希望这个简单而有效的方法将成为一个可靠的基准,有助于未来的实例层面识别的研究。

图1:用于实例分割的 Mask R-CNN 框架

Mask R-CNN 在概念上十分简单:Faster R-CNN 对每个候选物体有两个输出,即一个类标签和一个边界框偏移值。作者在 Faster R-CNN 上添加了第三个分支,即输出物体掩膜(object mask)。因此,Mask R-CNN 是一种自然而且直观的想法。但添加的 mask 输出与类输出和边界框输出不同,需要提取对象的更精细的空间布局。Mask R-CNN 的关键要素包括 pixel-to-pixel 对齐,这是 Fast/Faster R-CNN 主要缺失的一块。

最佳学生论文奖:也出自FAIR,何恺明也有参与

ICCV 2017最佳学生论文颁发给了FAIR的《密集物体检测Focal Loss》

这篇最佳学生论文也出自 FAIR 团队之手,一作是 Tsung-Yi Lin。值得一提,何恺明也有参与,不愧为大神。

摘要

目前,最准确的目标检测器(object detector)是基于经由 R-CNN 推广的 two-stage 方法,在这种方法中,分类器被应用到一组稀疏的候选对象位置。相比之下,应用于规则密集的可能对象位置采样时,one-stage detector 有潜力更快、更简单,但到目前为止,one-stage detector 的准确度落后于 two-stage detector。在本文中,我们探讨了出现这种情况的原因。

我们发现,在训练 dense detector 的过程中遇到的极端 foreground-background 类别失衡是造成这种情况的最主要原因。我们提出通过改变标准交叉熵损失来解决这种类别失衡(class imbalance)问题,从而降低分配给分类清晰的样本的损失的权重。我们提出一种新的损失函数:Focal Loss,将训练集中在一组稀疏的困难样本(hard example),从而避免大量简单负样本在训练的过程中淹没检测器。为了评估该损失的有效性,我们设计并训练了一个简单的密集目标检测器 RetinaNet。我们的研究结果显示,在使用 Focal Loss 的训练时,RetinaNet 能够达到 one-stage detector 的检测速度,同时在准确度上超过了当前所有 state-of-the-art 的 two-stage detector。  

再来看看最佳论文提名奖,今年有3篇论文入选,分别是:

  • First Person Activity Forecasting with Online Inverse Reinforcement Learinng

作者:Nicholas Rhinehart; Kris M. Kitani

  • Open Set Domain Adaptation

作者:Pau Panareda Busto, Juergen Call 

  • Globally-Optimal Inlier Set Maximasation for Simultaneous Camera Pose and Feature Correspondence 

作者:Dylan Campbell, Lars Petersson, Laurent Kneip, Hongdong Li

DeepMind CEO 哈萨比斯博士导师获终身成就奖;Caffe 团队获“无私贡献奖”

ICCV 2017 还宣布了其他奖项,得主也都是CV界如雷贯耳的人物/名字。下面分别做简单介绍。

Azriel Rosenfeld 终身成就奖

该奖用于奖励在长期职业生涯中为计算机视觉领域作出突出贡献的杰出研究者,Azriel Rosenfeld 终身成就奖颁发给了MIT的Tomaso Poggio教授。

Tomaso Poggio是MIT大脑和认知科学系Eugene McDermott教授,生物和计算学习中心联合主任,计算机科学和人工智能实验室成员,是AAAI Founding Fellow。Poggio 教授的博士生和博士后中不乏当今AI翘楚,包括Mobileye的创始人兼CTO Amnon Shashua,以及DeepMind 的创始人兼CEO Demis Hassabis。

杰出研究员奖(Distinguished researcher award)

基于主要研究贡献及影响激发其他研究,该奖项用于奖励对计算机视觉发展作出重大贡献的研究者。得主:Luc van Gool; Richard Szeliski

Luc van Gool是ETH Zurich大学教授,研究领域为计算机视觉和图像处理。Richard Szeliski是Facebook的研究科学家、计算摄影组主任。

Mark Everingham 奖

该奖项用于奖励为计算机视觉社区作出无私而重要贡献的研究员,包括个人和团队。今年的Everingham prize颁发给了Caffe团队和ICVSS组织者。

Caffe这个深度学习框架相信大家都很熟悉了,它的作者贾扬清现任Facebook研究科学家,曾在谷歌大脑工作,也是TensorFlow的作者之一。在获得这个“无私贡献奖”以后,贾扬清发布朋友圈,表示奖金已经捐献给伯克利工程院。在这里,我们也向Caffe 团队表示祝贺与感谢——贾扬清、Evan Shelhamer、Jeff Donahue、Sergey Karayev、Jonathan Long、Ross Girshick、Sergio Guadarrama、Trevor Darrell。

ICVSS全称International Computer Vision Summer School(国际计算机视觉暑期研讨会),是一年一度的计算机领域的重要会议。ICVSS组织者Sebastiano Battiato、Roberto Cipolla、Giovanni Farinella

Helmholtz prize 经典论文奖

本奖项认可对计算机视觉研究有重大意义、十年前的的论文,以表彰在计算机视觉领域作出的基础贡献。

  • I Laptev and T Lindeberg, Space-time interest points
  • A Efros, A Berg, G Mori, J Malik, Recognizing action at a distance
  • J Sivic, A Zisserman, Video Google: A text retrieval approach to object matching in videos
  • M Brown, D Lowe, Recognising panoramas
  • J Sivic, B Russell, A Efros, A Zisserman, W Freeman, Discovering objects and their location in images
  • K Grauman, T Darrell, The pyramid match kernel: Discriminative classification with sets of image features
  • M Blank, L Gorelick, E Shechtman, M Irani, R Basri, Actions as space-time shapes

腾讯优图12篇论文入选,3篇Oral,全球首个AI卸妆算法

按照惯例,除主要会议外,今年的ICCV还有其他一系列活动,包括44个workshop(比之前多了63%)、9个tutorial和产业展览。

工业界的参与度也很高。超过60家公司,包括创业公司和大公司,都在本届ICCV上展示他们的最新技术。组委会比较自豪的一点,今年来自企业的赞助是上届的3倍。

根据目前已经公布的结果,除了上文提到投稿数量大于20的机构,Facebook 有 15篇论文入选 ICCV 2017。腾讯优图团队也表现不俗,共有12篇论文入选,其中3篇被选做口头报告(Oral)——本届ICCV,只有2.09%的论文以oral的形式发表。

此次腾讯优图入选的论文提出了诸多亮点:全球首个AI卸妆效果的算法;现今最准确的单张图像深度估计算法;完美解决多帧信息融合困难的多帧超分辨率视频结果;史无前例的手机双摄图像匹配和分割研究成果。

腾讯优图与香港中文大学合作论文,美化人像的盲复原

在即将于11月8日举办的AI World 2017世界人工智能大会上,2017年5月加入腾讯优图的贾佳亚博士将发表题为《计算机视觉AI新认识》的演讲,他会把先进的计算机视觉研究成果做一个重新划分和归类,展示给大家一个有很多具体内容的视觉研究画卷。

贾佳亚介绍说,“一直以来,我们都在创新;所以我也会给大家看到新的有趣的应用,同时拨开云遮雾绕,还原视觉AI的技术真实水平。最后我也会和大家介绍腾讯优图实验室视觉AI的发展。”

原文发布时间为:2017-10-25

本文作者:闻菲,常佩琦,刘小芹

原文链接:【ICCV 2017华人雄起】何恺明包揽两项最佳论文,40%投稿来自中国

时间: 2024-11-18 17:47:56

【ICCV 2017华人雄起】何恺明包揽两项最佳论文,40%投稿来自中国的相关文章

【前沿】何恺明大神ICCV2017最佳论文Mask R-CNN的Keras/TensorFlow/Pytorch 代码实现

我们提出了一个概念上简单.灵活和通用的用于目标实例分割(object instance segmentation)的框架.我们的方法能够有效地检测图像中的目标,同时还能为每个实例生成一个高质量的分割掩码(segmentation mask).这个方面被称为 Mask R-CNN,是在 Faster R-CNN 上的扩展--在其已有的用于边界框识别的分支上添加了一个并行的用于预测目标掩码的分支.Mask R-CNN 的训练很简单,仅比 Faster R-CNN 多一点计算开销,运行速度为 5 fp

权威统计:空调用户关注四项指标海尔空调包揽两项第一

经历了2012年的寒冬,空调行业在2013年的表现成为了各方关注的焦点,近日,中国统计信息服务中心(国家统计局社情民意调查中心)发布2013年一季度<中国空调行业消费者行为研究报告>(以下简称<报告>),对刚刚过去的一季度空调市场消费者行为进行了盘点和分析.统计显示,一季度消费者关注热点集中在外观.功能.质量和服务四项指标,关注度相对均衡.其中海尔空调在功能和质量两项消费者重点关注的指标中表现出色,囊括两项关注度第一,继续着行业领跑的势头.记者了解到,该中心曾于今年一月份发布<

完整复现何恺明ICCV获奖论文结果并开源 !(附论文&amp;开源代码)

ICCV 作为计算机视觉的顶级会议,2017年共收到2143篇论文投稿,比上一届ICCV2015的1698篇增加了26.2%.共621篇被选为大会论文,录用比例28.9%:poster.spotlight.oral 比例分别为24.61%.2.61%和2.09%. 组委会根据作者署名统计了不同大学的研究数目,清华大学超过CMU.MIT.ICL.斯坦福以及谷歌名列第一,上海交通大学.北京航空航天大学也在前10当中. 而此次大会最大的新闻一定是何恺明大神在 ICCV 上拿下了双best paper!

从 20 篇ICCV 2017录用论文,看商汤科技四大攻坚领域

本文讲的是从 20 篇ICCV 2017录用论文,看商汤科技四大攻坚领域, 今秋,在以水城而闻名的威尼斯,来自世界各地的三千多位学者荟萃一堂,共赴两年一度的国际计算机视觉大会 (ICCV).这次大会的一个重要亮点就是中国学者的强势崛起.根据组委会公开的数字,会议 40% 的论文投稿来自中国的研究者.在中国的人工智能浪潮中,商汤科技以及它与港中文的联合实验室无疑是其中最有代表性的力量.在本届 ICCV 大会,商汤科技与香港中大-商汤科技联合实验室共发表了 20 篇论文,其中包括 3 篇 Oral

年度最精彩研究,CVPR 2017六篇最佳论文介绍(附打包下载)| CVPR 2017

雷锋网 AI 科技评论按:CVPR 2017的获奖论文已经在大会的第一天中公布,共有6篇论文获得四项荣誉.雷锋网 AI 科技评论对6篇获奖论文做了简要介绍如下. CVPR最佳论文 本届CVPR共有两篇最佳论文,其中就有一篇来自苹果. 「Densely Connected Convolutional Networks」 论文作者:康奈尔大学 Gao Huang,清华大学 Zhuang Liu,康奈尔大学 Kilian Q. Weinberger,Facebook 人工智能研究院 Laurens v

CVPR 获奖论文公布,苹果斩获最佳论文!| CVPR 2017

当地时间 7 月 22 号上午,夏威夷会议中心的卡米哈米哈 3 号大厅(Kamehameha III,以 19 世纪夏威夷国王卡米哈米哈三世命名)坐无虚席.CVPR 2017 的获奖论文在此正式揭晓. 本届 CVPR 共有两篇最佳论文.两篇最佳论文提名.一篇最佳学生论文.苹果去年 12 月发表的对抗网络 SimGAN 研究,是两篇最佳论文之一. 最佳论文 <Densely Connected Convolutional Networks> 即<密集连接的卷积网络>,作者是 Gao

MSRA获ACM TOMM 2017最佳论文:让AI接手繁杂专业的图文排版设计工作

你是否曾经为如何创作和编辑一篇图文并茂.排版精美的文章而烦恼?或是为缺乏艺术灵感和设计思路而痛苦?AI技术能否在艺术设计中帮助到我们?今天我们为大家介绍的这篇论文,"Automatic Generation of Visual-Textual Presentation Layout"(图文排版的自动生成算法研究),刚刚被美国计算机学会会刊ACM Transactions on Multimedia Computing, Communications and Applications (

体系结构顶会 ASPLOS 2017 最佳论文出炉,阿里云周靖人主旨演讲

2017年4月11日晚,在西安举行的架构体系的顶级会议ASPLOS(面向编程语言和操作系统的架构支持会议,Architectural Support for Programming Languages and Operating Systems)公布了最佳论文.最有影响力论文和 Test of Time 几项大奖. ASPLOS(编程语言和操作系统的体系结构支持会议)是ACM开办的一个以体系结构为核心内容的多学科会议,其研究领域跨越硬件.体系结构.编译器.编程语言.操作系统.网络和应用,尤其关注

周博磊知乎热答:如何评价何恺明大神斩获ICCV 2017最佳论文

2017年10月24日下午,Facebook AI 研究员何恺明大神斩获ICCV 2017最佳论文,这是他第三次斩获顶会最佳论文,对于Kaiming He 在 ICCV 2017 上拿下双 Best的paper,他的中大同学,另一位大神周博磊在知乎写了一段他眼中的凯明师兄. 大数据文摘经周博磊授权,发布这篇文章,看看大神眼中的大神是什么样? 其实从他发Dark Channel那篇论文开始,我就挺关注他的研究工作.那时候还是前Deep Learning时代的计算机视觉,一切都还不怎么work,还流