论文笔记之:Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking

 

Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking 

arXiv Paper

 

  Project Page:http://guanghan.info/projects/ROLO/

  GitHub:https://github.com/wangxiao5791509/ROLO  

  摘要:本文提出了一种新的方法进行空间监督 RCNN 来进行目标跟踪。我们通过深度神经网络来学习到  locations 的历史信息 和 具有判别性的视觉特征。收到最近的 bbox 回归技术的启发,本文研究了 LSTM 在时间领域的回归能力,可以连接高层视觉特征。跟现有的跟踪算法训练二分类器不同,我们在卷积层 和 recurrent unit 两个方面利用回归直接得到跟踪位置的预测。

  由于受到各种跟踪问题的挑战,许多 tracker 都是采用产生式或者判别式的方法来区分前景或者背景,也就是将跟踪看做是一个二分类问题。一个主要的缺点在于:严重依赖于手工设计的feature,无法结合物体的语义信息(semantic information),对于突然的形变并不具有鲁棒性。所以,随着深度学习的火爆,越来愈多的 tracker 开始采用深度feature。但是,在时序上的探索,几乎还没有。

  本文的关键动机是:tracking failures can often be effectively recovered by learning from historical visual semantic and tracking proposals

 

  算法流程

  如上图所示:算法的输入是 video frame,第一个框架是 YOLO,然后是 LSTM 单元,最终输出的是 target 的 location。

  然后文章介绍了 LSTM 和 YOLO 的相关背景知识,此处略去,详情请参考相关文章。

  

  本文提出的 tracker 的示意图,如下所示:

  

  网络的训练分为三个阶段

  1.  the pre-trained phrase of convolutional layers for feature learning;      卷积层的预训练,以提取 feature

  2.  the traditional YOLO training phase for object proposal          训练 YOLO 以产生 proposal

  3.  the LSTM training phase for object tracking.              训练 LSTM 进行跟踪

 



 

实验效果展示: 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

时间: 2024-07-30 21:59:32

论文笔记之:Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking的相关文章

论文笔记之:Learning Multi-Domain Convolutional Neural Networks for Visual Tracking

  Learning Multi-Domain Convolutional Neural Networks for Visual Tracking CVPR 2016   本文提出了一种新的CNN 框架来处理跟踪问题.众所周知,CNN在很多视觉领域都是如鱼得水,唯独目标跟踪显得有点"慢热",这主要是因为CNN的训练需要海量数据,纵然是在ImageNet 数据集上微调后的model 仍然不足以很好的表达要跟踪地物体,因为Tracking问题的特殊性,至于怎么特殊的,且听细细道来. 目标跟

Recurrent Convolutional Neural Networks for Text Classification

介绍了CNN表示文本的模型之后,本篇将会分享一篇用CNN结合RNN的模型来表示文本.paper题目是Recurrent Convolutional Neural Networks for Text Classification,作者是来自中科院大学的来斯惟博士. 本文要解决的问题是文本分类,文本分类最关键的问题是特征表示,传统的方法经常会忽略上下文信息和词序,无法捕捉到词义.近几年随着深度学习的火热,研究者们通过借助神经网络模型来解决传统方法存在的问题.比如:Socher提出的Recursive

(zhuan) Building Convolutional Neural Networks with Tensorflow

Ahmet Taspinar  Home About Contact Building Convolutional Neural Networks with Tensorflow Posted on augustus 15, 2017 adminPosted in convolutional neural networks, deep learning, tensorflow 1. Introduction In the past I have mostly written about 'cla

Convolutional Neural Networks for Sentence Classification

本篇将分享一个有监督学习句子表示的方法,文章是Convolutional Neural Networks for Sentence Classification,作者是Harvard NLP组的Yoon Kim,并且开源了代码 sent-conv-torch. 卷积神经网络(CNN)在计算机视觉中应用广泛,其捕捉局部feature的能力非常强,为分析和利用图像数据的研究者提供了极大额帮助.本文作者将CNN引用到了NLP的文本分类任务中. 本文模型架构图: 熟悉CNN结构的童鞋们看这个图就会非常眼

(转)A Beginner's Guide To Understanding Convolutional Neural Networks Part 2

Adit Deshpande CS Undergrad at UCLA ('19) Blog About A Beginner's Guide To Understanding Convolutional Neural Networks Part 2 Introduction Link to Part 1                 In this post, we'll go into a lot more of the specifics of ConvNets. Disclaimer:

论文笔记之:Deep Recurrent Q-Learning for Partially Observable MDPs

  Deep Recurrent Q-Learning for Partially Observable MDPs     摘要:DQN 的两个缺陷,分别是:limited memory 和 rely on being able to perceive the complete game screen at each decision point.  为了解决这两个问题,本文尝试用 LSTM 单元 替换到后面的 fc layer,这样就产生了 Deep Recurrent Q-Network (

论文笔记之:RATM: RECURRENT ATTENTIVE TRACKING MODEL

  RATM: RECURRENT ATTENTIVE TRACKING MODEL ICLR 2016     本文主要内容是 结合 RNN 和 attention model 用来做目标跟踪. 其中模型的组成主要是: 1. an attention model 主要用来从输入图像中提取 patch: 2. RNN 用来预测 attention 参数,即:下一帧应该 look 的问题.     Paper: http://xueshu.baidu.com/s?wd=RATM%3A+RECURR

论文笔记之:DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns

  DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns CVPR 2016   本文提出一种 分割图像 patch 的方法,因为细粒度的分类问题,如:行人动作识别 和 行人属性识别等等. Appearance Overview  本文提出一种利用 mid-level 深度视觉模式 进行动作和属性分类,这是属于细粒度分类任务.我们的一个想法是:一个较好的 embedding 可以改善聚类算法的质量.我们设计了一种迭代

循环神经网络(RNN, Recurrent Neural Networks)介绍

循环神经网络(RNN, Recurrent Neural Networks)介绍    这篇文章很多内容是参考:http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/,在这篇文章中,加入了一些新的内容与一些自己的理解.   循环神经网络(Recurrent Neural Networks,RNNs)已经在众多自然语言处理(Natural Language Proce