论文阅读:Prominent Object Detection and Recognition: A Saliency-based Pipeline

论文阅读:Prominent Object Detection and Recognition: A Saliency-based Pipeline 

 

如上图所示,本文旨在解决一个问题:给定一张图像,我们最应该关注哪些区域?怎么将其分割出来?这是一个什么东东?这三个子问题为一体。

 

Problem formulation: Given an image, determine the most influential item in the scene in terms of region of interest, pixel-level extent (segmentation), and object type. 

 

作者提出的框架为:

 



可以发现,上述流程图就是各个需要完成任务的级联和组合。

网络的训练也是各个级别依次完成的。没啥好说的。

有些实验结果看起来还是挺烂的:

 

 有的看起来还可以,但是也不怎么好:

 

时间: 2024-10-14 03:53:09

论文阅读:Prominent Object Detection and Recognition: A Saliency-based Pipeline的相关文章

论文阅读之: Hierarchical Object Detection with Deep Reinforcement Learning

  Hierarchical Object Detection with Deep Reinforcement Learning NIPS 2016 WorkShop    Paper : https://arxiv.org/pdf/1611.03718v1.pdf Project Page : https://github.com/imatge-upc/detection-2016-nipsws   摘要: 我们提出一种基于深度强化学习的等级物体检测方法 (Hierarchical Objec

论文阅读之 DECOLOR: Moving Object Detection by Detecting Contiguous Outliers in the Low-Rank Representation

DECOLOR: Moving Object Detection by Detecting Contiguous Outliers in the Low-Rank Representation Xiaowei Zhou et al.   Abstract-Object detection is a fundamental step for automated video analysis in many vision applications. Object detection in a vid

论文阅读之:Is Faster R-CNN Doing Well for Pedestrian Detection?

  Is Faster R-CNN Doing Well for Pedestrian Detection? ECCV 2016   Liliang Zhang & Kaiming He     原文链接:http://arxiv.org/pdf/1607.07032v2.pdf Code : https://github.com/zhangliliang/RPN_BF/tree/RPN-pedestrian     摘要:行人检测被人 argue 说是特定课题,而不是general 的物体检测

谷歌Borg论文阅读笔记(一)——分布式架构

传说中,Borg之前号称是Google内部和PageRanking相提并论的同等重量级的东西.现在公布了篇论文,读了一部分,还是有些地方没理解. 求讨论. Borg简介: Borg的作用是:提供一个标准任务规格语言,集成名字服务,实时任务监控,以及工具来分析和模拟系统行为. Google内部的集群管理系统调用都是用Borg来admits(准入),schedules(调度),starts,restarts,Borg还监控所有Google所有范围运行的应用. Borg的好处: 隐藏资源管理和故障处理

Apache Spark源码走读(一)Spark论文阅读笔记&Job提交与运行

<一>Spark论文阅读笔记 楔子 源码阅读是一件非常容易的事,也是一件非常难的事.容易的是代码就在那里,一打开就可以看到.难的是要通过代码明白作者当初为什么要这样设计,设计之初要解决的主要问题是什么. 在对Spark的源码进行具体的走读之前,如果想要快速对Spark的有一个整体性的认识,阅读Matei Zaharia做的Spark论文是一个非常不错的选择. 在阅读该论文的基础之上,再结合Spark作者在2012 Developer Meetup上做的演讲Introduction to Spa

谷歌Borg论文阅读笔记(二)——任务混部的解决

总算又往下读了一部分.Google的Borg论文中,前面部分讲的都是Borg的架构.后面有讲了一些资源隔离,安全隔离等的技术方案和策略. 主机层面的资源隔离,都是由是Borglet来操纵的. Google的混部情况: Google几乎所有的机器都是混部的,在一台机器上,可能运行着不同jobs的tasks.根据论文中所说,Google的50%的机器运行了9个甚至更多的tasks.90%的机器运行着25个tasks,达到4500个线程. 因此,Google有完善的隔离技术来保证task之间不相互影响

【独家】深度学习论文阅读路线图

如果你是深度学习领域的一名新手,可能会遇到的第一个问题是"应该从哪篇论文开始读起呢?" 这里给出了深度学习论文阅读路线图! 路线图按照下面四个准则构建而成: 从提纲到细节 从经典到前沿 从通用领域到特定领域 专注于最先进的技术 你将会发现很多近期发表但是确实值得一读的论文. 我们将持续不断的给这条路线图添加论文. 1 深度学习历史和基础 1.0  书籍 1.1调查 1.2 深度信念网络(DBN) (深度学习开篇的里程碑) 1.3 ImageNet进展(深度学习从此爆发) 1.4语音识别

Paper Reading: Perceptual Generative Adversarial Networks for Small Object Detection

Perceptual Generative Adversarial Networks for Small Object Detection 2017-07-11  19:47:46   CVPR 2017   This paper use GAN to handle the issue of small object detection which is a very hard problem in general object detection. As shown in the follow

深度学习论文阅读路线图

1.深度学习历史和基础 1.0  书籍 1.1调查 1.2 深度信念网络(DBN) (深度学习开篇的里程碑) 1.3 ImageNet进展(深度学习从此爆发) 1.4语音识别进展 阅读完上面这些论文后,通过对深度学习模型(包括CNN,RNN,LSTM)的基础框架,以及深度学习如何应用于图像和语音识别问题的理解,你将会对深度学习的历史有一个基本的认识.下面的论文将带你深入理解深度学习模型,深度学习在不同领域的应用和前沿.我们建议你根据自己的兴趣和研究方向选择下面的论文进行阅读. 2深度学习方法 2