利用深度学习优化视频结构 助力城市安防

深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。

深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。

视频结构化助力智慧城市建设

从技术角度来说,智慧城市就是感知、分析和提取城市系统的各种信息并做出相对应反馈的一整套城市管理系统,其中,原始的视频数据是城市系统信息的重要组成部分。现如今,海量视频数据已成必然,需要一套可以自动从视频中提取结构化信息的方案,把视频、图像“翻译”成机器可以理解的语言,并进行保存,确保后续提供给上层应用平台调用和处理的素材。

视频结构化的意义

视频或者图像数据,从前端传感器直接获得,从技术上来说,是一种非结构化信息。只有在实现结构化处理之后,才能将其中有价值的数据直观、高效的保存、处理和应用。

在智慧城市建设中,有成千上万路监控摄像头或者传感器,昼夜不停地监视或采集其他原始数据。其中,会产生海量的音视频数据,需要监控管理平台处理。即便人力充沛的情况下,面对庞大的视频数据,要求快速、准确地从海量数据中找到有效的信息,几乎是不可能的。受制于肉眼识别劳动强度的极限,在发生紧急事件时,人力调配和视频资源往往存在矛盾,不依靠计算机自动进行筛选,必然造成贻误战机。

视频结构化就是实现将海量视频中的人、车目标进行提取并识别的过程。一旦有重要事件发生,系统就可在数据库中快速查找到关键的“人”、“车”、“物”等相关音视频线索。针对海量监控视频录像的事后分析,传统以人海战术为主的视频线索查找,显然不能满足高效查找,正面临巨大挑战,急需一种更为高效的、自动的、智能的系统实现上述需求。

深度学习介绍

过去几年中,得益于高速的计算芯片(GPU)及大量的标注数据,作为当下最流行的机器学习方法,深度学习在各个应用领域中都取得了突破性的成绩,未来人们会拥有大量的AI,各种为私人定制的AI,包括医疗领域,制造业领域,在商业方面也会有各式各样的AI应用产生,包括:营销,供应链,预测及人力资源等,AI会以各种不同的方式出现在我们身边,例如:机器人,无人机和一些小型机器,AI将使机器更具智能化,使其变得更加安全易用。未来的AI发展速度将超越摩尔定律。由于几乎所有的人工智能领域的问题都可以转化为分类问题,因此机器学习的基本步骤可分为如下形式:

如上图所示机器学习是一个级联串行结构,因此每一环节的处理结果都会影响到最后的分类效果,在传统的机器学习中针对其中的各个环节都有其各自独立的算法。由于上述方法具有各自独立性,因此传统机器学习算法在处理问题时需要对各个环节进行优化,并通过组合优化方法在各个模块中选取最优的组合方式。

与传统机器学习相比深度学习可以把机器学习中的各个部分合成一个整体结构,通过统一的训练方法(Backpropagation)对其中所有的参数进行调节。当前人们所指的深度学习主要是以CNN(卷积网络)为核心的一系列应用算法,其算法结构如下图所示:

上图中的每一层都是采用卷积方式与某一卷积核进行卷积所得到的结果,每一结果代表了从原始图像所提取的特征,通过级联方式对图像或信号进行特征提取,最后得到人们想要的分类结果。

结合深度学习技术,实现视频结构化

在安防行业中,通过深度学习对视频进行结构化信息提取,完成了传统算法无法完成的功能,算法效果也得到大幅度提高。

传统的CV算法在处理视频算法时,往往先用检测或者比较简单的识别算法,将目标从背景中提取出来。然后,通过识别算法分辨是否是正常目标,最后判断目标类型。

而利用深度学习技术,可直接通过分类器,将目标从背景中识别出来再进行跟踪,同时可以直接得到目标类别。这种模式下,目标检测的准确率和跟踪的稳定性都能够大幅度提高。

同时,算法不需要根据不同目标类型调用不同模块进行目标分割或者特征提取,可直接利用目标识别结果,进行特征识别,直接获得相应的目标属性。

深度学习技术颠覆传统算法,轻松完成视频结构化信息提取。除此之外,结合深度学习本身的技术特色,还对车辆信息提取、人脸识别等已有功能进行改善,效果尤为明显。

在这之前,人脸识别在传统算法中,有非常好的效果。在预处理之后,通过提取特定的特征并对特征值进行训练,最后得到分类器,进行识别。深度学习优化了人脸识别的方案,将比较依靠专家选择的特征提取模块简化,通过输入样本即可直接训练得到分类器。

智能交通卡口或者电警摄像头智能抓拍车辆图片,并识别车辆号牌字符、车辆颜色、车辆类型等数据。引入深度学习技术之后,车辆的车系信息、年款等信息也被开发出来,更多的车辆信息被挖掘,为后续平台应用提供的更多的数据支撑。

本文转自d1net(转载)

时间: 2024-11-01 03:23:33

利用深度学习优化视频结构 助力城市安防的相关文章

独家专栏 | 如何利用深度学习搭建一个最简单的无人驾驶系统

雷锋网按:本文为雷锋网独家专栏,作者系佐思产研研究总监周彦武,雷锋网(公众号:雷锋网)经授权发布. 国内最牛的无人驾驶厂家的运算平台是这样的: 一个英特尔至强 E5 的 CPU,拥有 12 内核,30MB 的二级缓存,运算能力为 400GOPS/s,功率消耗为 400 瓦(应该是第一代至强 E5,目前 E5 最高功率消耗都不超过 180 瓦),八个英伟达的 K80 GPU,每一个 K80 的运算能力为 8TOPS/s,通过 PCI-E 连接,每一个 K80 的功率消耗为 300 瓦,合计是 28

关于深度学习优化器 optimizer 的选择,你需要了解这些

在很多机器学习和深度学习的应用中,我们发现用的最多的优化器是 Adam,为什么呢? 下面是 TensorFlow 中的优化器: 详情参见:https://www.tensorflow.org/api_guides/python/train 在 keras 中也有 SGD,RMSprop,Adagrad,Adadelta,Adam 等,详情: https://keras.io/optimizers/ 我们可以发现除了常见的梯度下降,还有 Adadelta,Adagrad,RMSProp 等几种优化

深度 | 做到这些值4亿美元:看 Nervana 如何利用深度学习实现数据革命

2016 年 8 月,英特尔为了加强其人工智能领域的能力,以 4 亿美元的天价收购了机器学习初创公司 Nervana .该初创公司成立仅仅两年,却被公认为是机器学习技术开发的领导者.近日,Nervana 的联合创始人兼首席执行官 Naveen Rao 博士在 StrataHadoop 上和大家深入探讨了深度学习的话题,通过其PPT,我们也能了解Nervana价值所在. Naveen 探索了许多方面,包括深度学习相对于其他机器学习技术的好处.该领域的最新进展.深入学习工作流程.开发和部署深度学习解

大规模深度学习优化技术在PAI平台中的应用及实践

1. 前言 自2012年Deep Learning的代表模型AlexNet在ImageNet大赛中力压亚军,以超过10个百分点的绝对优势夺得头筹之后,依托于建模技术的进步.硬件计算能力的提升.优化技术的进步以及海量数据的累积,Deep Learning在语音.图像以及文本等多个领域不断推进,相较于传统作法取得了显著的效果提升.   工业界和学术界也先后推出了用于Deep Learning建模用途的开源工具和框架,包括Caffe.Theano.Torch.MXNet.TensorFlow.Chai

吴恩达 NIPS 2016:利用深度学习开发人工智能应用的基本要点(含唯一的中文版PPT)

雷锋网按:为了方便读者学习和收藏,雷锋网(公众号:雷锋网)特地把吴恩达教授在NIPS 2016大会中的PPT做为中文版,由三川和亚峰联合编译并制作. 今日,在第 30 届神经信息处理系统大会(NIPS 2016)中,百度首席科学家吴恩达教授发表演讲:<利用深度学习开发人工智能应用的基本要点(Nuts and Bolts of Building Applications using Deep Learning)>. 此外,吴恩达教授曾在今年 9 月 24/25 日也发表过同为<Nuts a

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

《中国人工智能学会通讯》——2.27 利用深度学习改进统计机器翻译

2.27 利用深度学习改进统计机器翻译 利用深度学习改进统计机器翻译的核心思想是以统计机器翻译为主体,使用深度学习改进其中的关键模块,如语言模型[1] .翻译模型 [2] .调序模型 [3] .词语对齐[4]等. 深度学习能够帮助机器翻译缓解数据稀疏问题.以语言模型为例.语言模型能够量化译文的流利度,对译文的质量产生直接的重要影响,是机器翻译中的核心模块.传统的语言模型采用 n-gram方法,通过极大似然估计训练模型参数.由于这种方法采用离散表示(即每个词都是独立的符号),极大似然估计面临着严重

视频数据智能结构化 引领安防进入SDT时代

当下,大数据快速积累.大规模并行计算的实现以及新算法不断涌现成为了深度学习爆发的催化剂,这也直接推动了人工智能在很多传统领域中的进展.在安防行业中,人工智能也从概念逐步落地,人脸识别.图像识别等技术与视频监控系统的深度结合使得智能安防有了实质性的发展. 对数据的理解是安防大数据的入口 随着平安城市建设的不断推进,监控点位剧增,视频监控系统成为社会立体化防控的重要组成部分.据数据统计,2016年的高清摄像头每天产生的数据比2015年产生多337PB.而目前在城市数据中,视频监控也成为所有数据中占比

视频图像处理技术优势安防视频监控应用

随着科技的发展和时代的不断进步,视频和图像数据处理技术已经逐渐成熟起来,对人们的生活和工作起着重要的作用.未来,视频监控与我们生活的联系将日益密切.毫无疑问,视频图像处理技术的研发是时下最大的安防热点之一,也是众多安防企业值得关注的一个领域. 视频图像处理技术的四大技术 视频图像处理过程中会涉及到对视频图像数据的采集.传输.处理.显示和回放等过程,这些过程共同形成了一个系统的整体周期,可以连续性的运作.在视频图像处理技术范围内最主要的就是包括了图像的压缩技术和视频图像的处理技术等.目前,市场上主