深度学习奏响智能视频分析技术新乐章

在2017年两会热词中,被誉为互联网下一个风口的人工智能,成为两会期间大众的关注热点,与创业紧紧联系在一起,成为创业者的新宠。同时,网友也热衷于深扒人工智能背后的“黑科技”,深度学习技术也因此成为关注点聚焦。其实,深度学习和安防搭配食用更美味。

  深度学习奏响智能视频分析技术新乐章

随着各地视频接入规模的迅猛增长及视频监控对高清、智能、联网的要求越来越高,每天产生的数据量正以惊人的速度在不停增长。视频监控正迎来全新的大数据时代,数据越来越成为最宝贵的资源,如何有效对数据进行存储、共享以及应用变得愈加重要。在这个新时代,智能化也成为视频监控的新趋势。

一、传统智能视频分析技术的不足

智能视频分析技术利用一些图像处理、模式识别或机器学习等领域的算法来分析视频序列中的信息,以达到理解视频内容的目的,也有人称为视频内容分析。有了智能视频分析技术,我们就可以及时地发现视频中的异常情况,第一时间做出反应,减少损失。

当我们还在憧憬着智能视频分析技术的前景时,现实给所有安防智能化厂商上了沉重的一课。很多智能视频分析技术受限于应用场景,为了得到较好的准确率,往往需要“天时”、“地利”和“人和”。好不容易凑齐了三个要素,提供了非常标准的场景,我们仍可能遇到智能分析“罢工”的情况。其实,问题就出在算法本身上。

首先,传统的智能分析算法通常采取人工选择特征的方法,如尺度不变特征,方向梯度直方图特征,局部二值模式特征等。很明显,特征选择的好坏直接决定着算法准确率的上限。算法研究团队的重点任务变成了投入更多的人力去挖掘出更好的特征。

数据集越大,特征越难发现和选择,就好像一个无底洞一样,不断地试探,不断地积累,时间和人力成本相当之高。而所谓SIFT特征、HOG特征、LBP特征,都是算法人员在某种假设的前提下,寻找特定数据集在某一层面的表示。但这种表示是否真的有效,还是要靠算法人员的经验和运气呢?每种特征都有自己的提取方式,遵循着自己的理论支持,但如果理论假设本身与现实相悖呢?我们无从知晓。

其次,有些智能分析算法模型为浅层学习模型,如支持向量机、逻辑回归等。浅层学习模型通常有0或1层隐层节点,可以在一定规模的数据集下发挥较强的表达能力。但当数据量不断增大时,这些模型就会处于欠拟合的状态。通俗点说就是数据量太大,模型不够复杂,覆盖不了所有数据。而算法模型无法解析大数据,直接制约了其应用的广度和深度,也限制了其进一步发展的空间。

深度学习技术的兴起,为我们解决了以上问题。在讨论深度学习技术之前,我们先来谈一谈大数据,因为深度学习与大数据密不可分。

二、大数据时代的变革

生活在大数据时代的算法人员是幸运的,因为他们拥有数据;生活在大数据时代的算法人员也可能是不幸的,如果他不懂得如何利用这些数据,陷入数据的汪洋中无从抽身。大数据对智能视频分析技术有着深远的影响意义。

大数据时代为算法研究提供了足够多、足够丰富的训练样本。样本的容量和种类是算法模型是否具有泛化能力的重要因素。换句话说,训练样本集的规模决定了模型能否对训练样本以外的数据有效的解释。传统的算法研究不可避免地要遇到小样本问题为了解决小样本问题,模型中加入了很多技巧性的手段,并都没有本质的区别,小样本仍然存在。大数据时代,问题的解决就变得简单粗暴多了。将所观测到的海量数据扔进模型中训练,只要模型足够复杂,就能够有效地表示这些数据。

大数据时代为算法研究提供了高效的计算工具。前面提到,数据量的增加意味着需要更复杂的模型来诠释它。我们辛辛苦苦构建了一个模型,到头来发现模型无法求解,或者求解的时间远远超出我们的想象。我们只能眼巴巴地看着一堆数据,然后酸酸地说,大数据似乎没那么有用。值得庆幸的是,有人已经走在了前面。无论是分布式计算、并行计算还是云计算,都在为之努力,试图解决日益增长的计算能力需求。

三、深度学习技术的出现

许多工业界、互联网界的业内大佬已经开始利用大数据开发了一些系统。百度利用一个近10万小时的语音数据集开发出一款语音识别系统。据介绍,这个系统可以在嘈杂环境下实现81%的准确率。与传统的语音识别系统不同,这套系统并没有采取标准的、计算代价昂贵的声学模型,而是给算法提供丰富的数据,然后让它自己去学习,并取得了卓越的性能。

在这些成果的背后,有着一套共同的算法框架,那就是深度学习。前面提到过浅层学习模型,而深度学习,往往含有更深的层次结构。我们可以认为高层级的特征是由底层级的特征组合得到的。越是低层,特征越简单,如一些直线、斜线、曲线等。越是高层,特征越抽象,越接近所要表达的意图。我们回到图像分析的范畴,对于一个图片来说,最低级的特征是像素,也就是0到255的矩阵。我们通过像素,无法理解图片里的目标是什么。我们从像素中找到了边缘特征,然后用边缘特征组合成不同的部件,最后形成了不同种类的目标物。显然这个是我们所想要实现的。

深度学习初期是一种无监督的特征学习算法,减少了人工干预的步骤,通过多层迭代得到更优的特征。本质上,深度学习也是一种非线性变换,但通过多层嵌套,更适合应用于对大数据内部关系的表示。

四、深度学习的应用

近年来,深度学习在语音识别、图像识别、自然语言处理等应用中取得了显着的成效。但是在安防行业,深度学习刚刚起步。笔者注意到,已经有很多安防企业开始投入资源开发基于深度学习技术的算法、产品。可见,深度学习正影响着安防企业,影响着智能视频分析技术。接下来我们将从几个行业应用来分析深度学习的前景。

1、人脸识别应用。事实上,在安防领域的人脸识别还没有达到理想的效果。究其原因,视频中的人脸处在一种非常复杂的状态。光照、姿态、表情、饰物、分辨率等都影响着人脸识别算法。已有的训练算法,或者说已有的训练数据无法调整出一个具有很强泛化能力的算法模型。未来的人脸识别模型如果想要取得突破,一方面需要更多更丰富的样本数据,如各种光照、姿态、表情下的人脸图像。谁掌握了大数据,谁将抢夺先机。另一方面,深度学习模型还需要进一步优化。深度模型的理论性还需要加强。到底什么样的模型才算是最优的表示,目前并没有很好的答案。

2、车辆特征识别应用。作为智能交通的一个典型应用,车辆特征识别一直是安防厂商重点关注的技术领域。早期的车辆特征通常为车牌号码和车身颜色等。前几年各大厂商推出的产品都能对车牌号码和车身颜色进行准确识别,但对于车辆品牌和车型系列这些更加复杂的信息特征,并没有很好的识别手段。近两年,深度学习技术兴起,很多厂商利用大规模的数据集训练取得了实质性进展。目前行业水平已经可以达到上千种车系和上百种车标的识别。识别的准确率也已达到实用程度。今后的智能交通设备所能提取的车辆特征将更加丰富,将有助于提升业务部门的工作效率,推动智能交通行业的发展。

深度学习还有很多应用场景,只要涉及到目标检测、目标识别的地方,理论上都可以应用深度学习来解决。就像百度首席科学家吴恩达在一些报告中提到的,深度学习可以取代现有的很多特征提取、目标检测技术。在未来,深度学习技术将与安防应用碰撞出更多的火花。

五、结束语

智能视频分析技术从产生开始,一直备受关注。经历了起初的期待,走过了应用的无奈,到如今重新审视技术本身,智能视频分析确实还有很长的一段路要走。深度学习和大数据为智能视频分析技术提供了前进的方向。我们也期待,未来有更多新的、合理的模型出现,为我们提供可用的方法,让设备真正拥有“智能”,让安防真正成为大家心目中的“智能安防”。

本文转自d1net(转载)

时间: 2024-09-20 06:22:45

深度学习奏响智能视频分析技术新乐章的相关文章

细数智能视频分析技术应用四个热门领域

近年来,研究者在智能化监控技术的运动检测.目标跟踪.视频分割.行为识别等领域进行了很多研究并取得了很多成果.智能视频监控系统正成为学术界.工业界新兴的研究热点和开发方向,美国.英国和法国等研究机构都进行了智能监控项目中的目标跟踪.异常行为监测与报警等的研究.许多业界知名公司也对智能监控进行了深入的研究,如Intel. Microsoft.IBM等:国内很多大学与研究机构也开展了视频智能分析理解研究. 目前智能视频分析技术在各种视频监控领域都有应用,并取得了比较好的监控效果,天地伟业在智能交通.智

智能视频分析,视频监控新的标准应用

毋庸置疑,过去的五年是视频监控产品和市场飞速发展的五年. 随着高清摄像机的普及, 用户的视觉应用体验得到质的飞跃.IP和IT技术的广泛引入,视频监控应用的地域限制被彻底地打破,类似的极具现场即视感的视频监控成为了接受程度最广的安防系统.每一天,成千上万的摄像机被安装和开通,巨量的存储被部署在本地或者云端,这些系统不间断地为各行各业的用户产生海量的视频数据,这些数据被观看.记录.存储和传输为各种可视化的应用提供基本的原始数据基础.观察视频监控行业的发展,也让我们有了许多的疑问和思考. 文/博世集成

智能建筑为视频分析技术提供更大舞台

随着监控高清摄像机的普及,智能视频分析技术的日趋成熟和完善,越来越多的行业对智能视频分析的要求也越来越高,应用的场景相比以往更为宽泛,也更为细化.针对监控中智能视频分析的一些常用功能,我们从智能建筑方面,对智能分析的部分场景应用进行简单的分析. 一.智能分析的类别 智能视频分析技术(VideoAnalytics)涉及图像处理.跟踪技术.模式识别.人工智能.数字信号处理(DSP)等多个领域.主要的智能分析产品集中在前端和后端两大类.前端智能是将一些视频分析算法移植到摄像机中,在摄像机中实现对实时视

基于深度学习的智能问答

作者:周小强 陈清财 曾华军 1引言 纵观自动问答系统的技术发展历史,从1950年代因图灵测试而诞生至今,已经有几十年的历史.但真正在产业界得到大家的广泛关注,则得益于2011年Siri和Watson成功所带来的示范效应.自此,自动问答系统较以往任何时候都显得离实际应用更近.这一方面归功于机器学习与自然语言处理技术的长足进步,另一方面得益于维基百科等大规模知识库以及海量网络信息的出现.然而,现有的自动问答系统所面临的问题远没有完全解决.事实上,无论是业界应用还是学术研究,问句的真实意图分析.问句

基于深度学习的智能安防系统结构探讨

智能安防的概念提出已经有相当长时间了,但是道路并不平坦,受限于计算机视觉算法和前端设备处理能力,许多功能一直无法成熟应用.但是厂商在宣传智能水平方面往往有夸大的冲动,使得产品在部署使用后,实际性能与用户期待相去甚远.虽然这种情况使得安防领域的智能化陷入了一段尴尬时期,同时也降低了用户的期望值,使用户更加理性的看待智能安防技术,也使得真正优秀的智能安防产品能得到机会.最近数年来深度学习算法的快速发展,在各类人工智能问题上的优异表现给智能安防领域带来了新的机遇.在深度学习迅速发展的大背景下,本文就智

《深度学习导论及案例分析》一第一部分 基 础 理 论

   本节书摘来自华章出版社<深度学习导论及案例分析>一书中的第1章,第1.1节,作者李玉鑑  张婷,更多章节内容可以访问"华章计算机"公众号查看. PART1 第一部分 基 础 理 论   本书第一部分主要探讨深度学习的基础理论.深度学习起源于神经网络,其本质是一系列深层网络模型的学习和训练算法.本部分涵盖了深度学习的主要内容,有助于读者在总体上把握深度学习的发展脉络和体系结构,是开展进一步相关工作的基础. 这部分共包括13章.第1章勾画深度学习的起源和发展.特点和优势.

《深度学习导论及案例分析》一3.2受限玻耳兹曼机的学习算法

本节书摘来自华章出版社<深度学习导论及案例分析>一书中的第3章,第3.2节,作者李玉鑑 张婷,更多章节内容可以访问"华章计算机"公众号查看. 3.2受限玻耳兹曼机的学习算法 受限玻耳兹曼机的学习就是对模型参数集θ进行计算,常用的方法是最大似然估计,其基本思想在于采用梯度上升算法最大化总体对数似然函数.在给定可视向量训练集S={v(l),1≤l≤N}时,受限玻耳兹曼机的对数似然函数定义为 lRBM(θ)=log∏Nl=1p(v(l)θ)=∑Nl=1logp(v(l)θ)(3.

《深度学习导论及案例分析》-第1章 概述 1.1深度学习的起源和发展

第1章 概述 如何让机器从经验中学习长期以来都是哲学界和科学界的研究目标之一.学习能力对人类智能的形成和发展无疑起着至关重要的作用,而机器学习的研究显然有助于提高人工智能的水平.从原始的输入数据到产生意义的理解过程往往需要经过许多不同层次的信息处理.转换.表达和抽象,如果涉及的层次较深,深度学习的模型和方法就可能发挥重要作用.本章主要勾画深度学习的起源和发展.特点和优势.模型和算法. 1.1深度学习的起源和发展 作为一种实现人工智能的强大技术,深度学习(deep learning)已经在手写数字

《深度学习导论及案例分析》一 第1章 概述1.1深度学习的起源和发展

第1章 概述 如何让机器从经验中学习长期以来都是哲学界和科学界的研究目标之一.学习能力对人类智能的形成和发展无疑起着至关重要的作用,而机器学习的研究显然有助于提高人工智能的水平.从原始的输入数据到产生意义的理解过程往往需要经过许多不同层次的信息处理.转换.表达和抽象,如果涉及的层次较深,深度学习的模型和方法就可能发挥重要作用.本章主要勾画深度学习的起源和发展.特点和优势.模型和算法. 1.1深度学习的起源和发展 作为一种实现人工智能的强大技术,深度学习(deep learning)已经在手写数字