深度学习 目标检测算法 SSD 论文简介

 

深度学习 目标检测算法 SSD 论文简介 

 

一、论文简介:

  ECCV-2016 Paper:https://arxiv.org/pdf/1512.02325v5.pdf 

  Slides:http://www.cs.unc.edu/~wliu/papers/ssd_eccv2016_slide.pdf

二、代码训练测试:

  https://github.com/weiliu89/caffe/tree/ssd 

 

 



 

一、论文算法大致流程:

1.类似“anchor”机制:

 

如上所示:在 feature map 上进行类似 proposal 的 Bbox 提取,然后大于某一阈值的 Bbox 被认为是 positive samples。后面进行分类回归。

 

2.整个网络架构设计如下所示:

 

 该框架和 Faster RCNN 最重要的两个区别在于:

  1. 将 Faster RCNN 的卷积加全连接层的网络结构,转换为:全卷机结构。这一改变,使得检测的速度,得到很大的提升。

  2. 将 RPN 提取 proposal 的机制,转移到各个 scale 的 feature map 上进行,使得检测的精度也非常高。

 

  基于这两个改善的基础上,使得SSD在物体检测算法中脱颖而出。

 



 

 

 

时间: 2024-09-18 08:36:26

深度学习 目标检测算法 SSD 论文简介的相关文章

目标检测算法SSD之训练自己的数据集

目标检测算法SSD之训练自己的数据集 prerequesties 预备知识/前提条件 下载和配置了最新SSD代码 git clone https://github.com/weiliu89/caffe ~/work/ssd cd $_ git checkout ssd 编译caffe 下载必要的模型(包括prototxt和caffemodel): 运行了evaluation和webcam的例子,会提示caffe的import报错.添加pycaffe路径到PYTHONPATH环境变量,或者写一个_

代码-深度学习 人脸检测c++实现

问题描述 深度学习 人脸检测c++实现 5C 深度学习算法c++实现代码,能准确检测人脸即可,手光照等的影响尽可能减少,不需要实现识别 解决方案 用OpenCV来做,OpenCV是开源的 解决方案二: 百度opencv人脸识别 在浅墨毛星云的csdn里有 解决方案三: 一般网上的都不成熟,建议你可以找如科大讯飞等合作 解决方案四: 我试过阿里的face++提供的人脸检测api,效果感觉挺不错的诶,一些论文提供的人脸检测方法对于证件照这样的图片总是会识别成非人脸,它倒是可以正确的检测到,不过有时候

《Shadowsock翻墙流量检测算法》论文翻译

本文讲的是<Shadowsock翻墙流量检测算法>论文翻译, 翻译前言 随着机器学习技术的火热,国内不少实验室一窝蜂的将机器学习纳入自己的科研课题研究之中,这样可以更好的找到发论文的结合点.我之前的所在实验室就曾将机器学习引入漏洞挖据的研究之中,取到了很好的效果.但是据我所知,有些研究课题将机器学习引入并没有带来多少收益.本文将机器学习引入Shadowsock翻墙流量的检测,旨在提高准确率节省人力,我认为准确率的提高主要在于:特征的抽象和训练数据的规模.论文中并没有详细的数据说明,我对于准确率

《中国人工智能学会通讯》——7.11 深度学习在推荐算法上的应用进展

7.11 深度学习在推荐算法上的应用进展 最近几年是深度学习发展的黄金时间,其在多个领域取得了重要进展,包括图像领域.语音领域.文本领域等.深度学习为科研工作者提供了一种非常有效的技术途径,其本质上是对数据特征进行深层次的抽象挖掘,通过大规模数据来学习有效的特征表示以及复杂映射机制,从而建立有效的数据模型.从方法上来说,深度学习具有的优点本质上是领域无关的.因此,在可预见的未来,深度学习将会作为一种较为通用的数据建模方法,对于多个潜在领域的应用产生重要影响. 在信息大数据时代,用户的个性化需求不

物体检测算法 SSD 的训练和测试

物体检测算法 SSD 的训练和测试    GitHub:https://github.com/stoneyang/caffe_ssd  Paper: https://arxiv.org/abs/1512.02325    1. 安装 caffe_SSD: git clone https://github.com/weiliu89/caffe.git cd caffe git checkout ssd 2. 编译该 caffe 文件,在主目录下: # Modify Makefile.config

深度学习-一篇图像标注论文的实现

问题描述 一篇图像标注论文的实现 10C 求问有大神知道这篇文章在哪里有人实现或者有大神实现了这篇文章?Deep Convolutional Ranking for Multilabel Image Annotation

深度学习零基础进阶第四弹​|干货分享

雷锋网曾编译了<干货分享 | 深度学习零基础进阶大法!>系列,相信读者一定对深度学习的历史有了一个基本了解,其基本的模型架构(CNN/RNN/LSTM)与深度学习如何应用在图片和语音识别上肯定也不在话下了.今天这一部分,我们将通过新一批论文,让你对深度学习在不同领域的运用有个清晰的了解.由于第三部分的论文开始向细化方向延展,因此你可以根据自己的研究方向酌情进行选择.雷锋网对每篇论文都增加了补充介绍.这一弹主要从自然语言处理以及对象检测两方面的应用进行介绍. 本文编译于外媒 github,原文标

从零开始码一个皮卡丘检测器-CNN目标检测入门教程(上)

本文先为大家介绍目前流行的目标检测算法SSD (Single-Shot MultiBox Object Detection)和实验过程中的数据集.训练.测试过程及结果参见<从零开始码一个皮卡丘检测器-CNN目标检测入门教程(下)> 目标检测通俗的来说是为了找到图像或者视频里的所有目标物体.在下面这张图中,两狗一猫的位置,包括它们所属的类(狗/猫),需要被正确的检测到. 所以和图像分类不同的地方在于,目标检测需要找到尽量多的目标物体,而且要准确的定位物体的位置,一般用矩形框来表示. 在接下来的章

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

不同于在目标检测和识别等领域取得的丰硕成果,深度学习在目标跟踪领域进展相对缓慢,很大原因是缺乏数据--目标跟踪只有第一帧的标定框作为训练数据,在这种情况下训练一个深度模型十分困难.现有的基于深度学习的方法从几个不同的角度解决这个问题,但在跟踪速度和精度方面仍有很大的提升空间. 在目标追踪界泰斗.UC Merced 杨明玄教授的指导下,香港城市大学.阿德莱德大学.SenseNet的研究人员从深度学习的角度出发,提出了一种端到端的跟踪模型,将特征提取和响应生成融合在深度学习框架中,只采用单层卷积的端