音频监控,如何让”好声音”从听得见到听得懂?

10月,在东半球最好的相声晚会——“锤子手机”发布会上,科大讯飞的语音识别技术意外火了。罗永浩花了二十分钟来讲锤子手机采用的这项技术。

而在安防领域,音频系统早已是安全防范系统的重要组成部分。虽然超过70%的网络摄像机拥有单向或多向的音频功能,但真正实际应用音频功能的监控摄像机却很少。对未来音频监控市场的分析认为,会保持稳步增长的趋势,增幅会在10%左右。IHS预测未来音频功能将在视频监控系统中得到更多的重视。

在很多事件中,我们调取录像资料,发现只有画面没有声音,一切只靠当事人的口供,无疑给公安机关侦破案件带来障碍,公众的质疑很难避免。加装音频监控无疑将会解决质疑的问题并且增加证据的说服力。

因此,现在很多的智慧安防系统,已经要求增加音频采集,例如在平安城市、公检法办案区、金融机构、公共交通、教育监考、行政服务、执法取证等领域,越来越多的优质项目需要高清晰、高保真的音视频同步监控系统,在优质安防工程中已凸显出音频监控的重要性。

如何从“听得见”到“听得懂”?

声纹识别

音频监控经过多年的发展,已经可以做到通过声音的识别来判断说话人的情绪、所处的环境等问题。而在音频监控环节中,声纹识别提供了重要的技术支撑。

声纹识别属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。这里需要强调的是,和语音识别不同,声纹识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性,而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。

同时,与其他生物识别相比,声纹识别的应用有一些特殊的优势:

(1)蕴含声纹特征的语音获取方便、自然,声纹提取可在不知不觉中完成,因此使用者的接受程度也高;

(2)获取语音的识别成本低廉,使用简单,一个麦克风即可,在使用通讯设备时更无需额外的录音设备;

(3)适合远程身份确认,只需要一个麦克风或电话、手机就可以通过网路(通讯网络或互联网络)实现远程登录;

(4)声纹辨认和确认的算法复杂度低;

(5)配合一些其他措施,如通过语音识别进行内容鉴别等,可以提高准确率;

这些优势使得声纹识别的应用越来越受到系统开发者和用户青睐,声纹识别的世界市场占有率15.8%,仅次于指纹和掌纹的生物特征识别,并有不断上升的趋势。

声音定位

人们经常借助听觉来判断发音物体的位置。例如,当你独自行走时,突然听到一个响声,你会立刻判断出这个声音是什么声音、对你有无威胁、它来自何方等等。确定声音的方向和距离需要比较来自两耳信息,虽然你会很快做判断和反应,但声音定位过程是听觉系统复杂综合的功能。

而声音定位则是通过强度差、时间差、因色差、相位差等来实现。

音频场景分析

作为人们感知外界环境的一个重要通道,听觉在视线障碍、不利光照条件等情况中可起到视觉无法替代的作用,是视觉的重要补充。相比于图像数据,音频信号往往可使用相对简单的设备进行采集并且占用更少的存储空间和处理时间。随着当前移动平台计算能力的不断提高,出现了越来越多基于音频的各类应用,所涉及的音频处理算法一直是相关研究领域的重点。

其中,提取、分析和有效利用音频数据所携带的语义信息,对基于内容的多媒体检索、摘要以及开发上下文自适应的应用等具有重要意义。

音频场景分析主要是为了分析、决策、预警所监听环境下发生的异常行为。其核心技术是基于各类异常声音在时域、频域的特征,结合模式识别的分类方法对异常事件报警。

语音识别

与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。

语音识别技术经过几十年的发展,基于深度学习的人工智能语音将得到大范围的应用。

音频监控在安防领域大有可为

由于传统视频监控系统,受摄像机镜头和安装角度限制,监控区域很难做到无死角覆盖,即使通过多角度安装摄像机,也无法保证全覆盖,由于摄像机图像采集受诸多环境因素(例如:现场照明、强光源干扰等)影响而无法有效采集现场图像。而音频监控技术由于音频本身的技术特性,基本上不存监控死角,能更有效的掌控现场的实时情况。所以音频监控技术越来可以更好的弥补视频监控技术的不足。

同时,声音具有一系列独有的特征,如不受白天和黑夜的影响,不容易遮挡,具有方向性等等。在球机上安置拾音器,对声音的方向进行定位,当检测到异常声音时控制球机到相应位置,这样一来,在一定程度上就可以第一时间看到异常声音所处位置的实时视频,为判定事态提供了多种信息。(本文部分技术支持来源于快鱼电子)

人工智能时代,语音技术以及和语音技术相关的应用、图像技术以及相关应用在今天变得格外重要。而围绕着语音、图像以及其他传感器所产生的数据,以及这些数据的生产、分析、组织和消费,在之后的很长的时间里,注定会成为智能领域中最重要的发展方向。我们期待智能音频带给安防的巨大变化。

本文转自d1net(转载)

时间: 2024-12-28 12:27:07

音频监控,如何让”好声音”从听得见到听得懂?的相关文章

音频监控叫好又叫座,核心部件拾音器怎么装?

现在人们日常生活中的突发事故越来越多,人们"有据可依"的防范意识越来越强,视频监控已经成为人们采集证据的重要来源之一,随之人们对于音频监控也越来越重视.在安防视频监控领域,音频监控的加入使得监控不再只是上演"无声电影". 近年,国家的一些相关政策的出台,要求一些监控场所必需视频音频同步,这也给音频监控带来了一定的市场,目标也开始从"看得见"上升到"看得清"."听得见". 目前,音频监控已广泛应用在公共设施当

音频监控叫好又叫座 核心部件拾音器怎么装?

现在人们日常生活中的突发事故越来越多,人们"有据可依"的防范意识越来越强,视频监控已经成为人们采集证据的重要来源之一,随之人们对于音频监控也越来越重视.在安防视频监控领域,音频监控的加入使得监控不再只是上演"无声电影".近年,国家的一些相关政策的出台,要求一些监控场所必需视频音频同步,这也给音频监控带来了一定的市场,目标也开始从"看得见"上升到"看得清"."听得见". 现在人们日常生活中的突发事故越来越多,

技术篇丨音频监控应用现状分析

音视频监控是安全防范系统的重要组成部分,它是一种防范能力较强的综合系统,直观.准确.及时和信息内容丰富使其突出的特点.传统的监控系统大都没有声音,人们只能看到无声的图像,音频监控并未能得到很好的推广.音频监控作为安防行业近年来迅速发展的一个分支,近年应用点也在不断扩大. 目前音频监控应用较多的场所有: 检察院.监狱.公安等单位 国家在对一些特殊的场地,场合,要求有视频必须有音频同步.例如检察院审讯同步录音录像系统.公安局预审系统.看守所监狱监管系统等.天安门广场.最高法院.国家信访局等重要国家机

hook-C# 全局键盘监听Hook监听不到

问题描述 C# 全局键盘监听Hook监听不到 使用的是网上的Hook轮子,如下 using System;using System.Collections.Generic;using System.Text;using System.Runtime.InteropServices;using System.Windows.Forms;using System.Reflection;namespace HookTest { /// <summary> /// 键盘钩子 /// [以下代码来自某网

懒人听书怎么听书 懒人听书付费书籍怎么听书?

懒人听书怎么听书 登录 在首页点击自己喜欢的书籍: 进入书籍页面,点击播放: 选择要播放的章节进行播放,在页面的右上角点击如图所示的图标,就可以进入播放页面了: 在播放页面,我们可以下载.分享.定时等等. 懒人听书付费书籍怎么听书? 1.打开懒人听书,注册登录:(可用微博.微信和QQ登录) 2.点击进入[账号]页面: 3.点击[VIP会员]: 4.在会员页面,选择要购买的会员类型,点击[购买]: 5.选择支付方式,进行付款. 好了上文就是小编为各位整理的一篇关于懒人听书怎么听书 懒人听书付费书籍

你要听消费者,听的是市场,因为市场才能决定未来

摘要: 从事互联网工作,也是受马云的影响.他带给我们的是一种精神,永不放弃,执着追求自己的理想的精神.每次听他演讲,都会去反思自己,这次也不例外,反复听了多次,有些话语, 从事互联网工作,也是受马云的影响.他带给我们的是一种精神,永不放弃,执着追求自己的理想的精神.每次听他演讲,都会去反思自己,这次也不例外,反复听了多次,有些话语,让我产生了共鸣!摘出一些对草根站长有思考性的论点,阐述我对网站发展的一些思索! 1.市场才能决定未来 引言:你要听消费者,听的是市场,因为市场才能决定未来. 草根站长

Windows 10系统怎么听音乐 win10听音乐的方法

如果使用过win8系统听音乐的朋友估计对于win10听音乐功能已经了解了,因为两者几乎完全一样了,我们在win10中双击音乐文件即可播放音乐,如果先打开播放工具再播放音乐,可按照以下步骤操作: 我们进入到"更改具体的查看位置"来进入音乐的添加了,操作步骤非常的简单了. 添加音乐后即可播放音乐,播放界面如下:   非常的简单,其实就是说win10自带的音乐播放器了并且可以播放网络上的音乐了,这个估计是第三方音乐播放器的终结者.

音频安防监控中的拾音器有哪些难题

许多网络摄像机提供音频支持,无论是内置麦克风还是/或麦克风/线路输入插孔,音频信号通过网络进行传输,传统的监控系统大都没有声音,就像早年的无声电影,人们只能看到无声的图像,现在很多的监控系统已经要求集成音频.拾音器在安防监控中的直角会面临哪些技术难题,其实际操作需要注意哪些?     一.拾音器在音频安防监控中的三大技术难题 1.长期以来音频监控技术发展缓慢,噪声处理难度大 人声和噪声经过放大后很容易混淆在一起,就算是装上拾音器听到的也是噪声,音频监控没有达到其目的和意义.拾音器降噪需要解决两方

移动监控应用广泛 在安防行业搅起一池“春水”

移动安防的应用范围广泛,不仅仅深入到了之前的安防产业业务范围,还创造出了许多新的业务形态,从大型安防项目到民用安防项目都有涉及.大型移动安防项目如平安城市.智能交通等:民用移动安防应用如智能家居管理.视频监控.门禁系统和防灾防盗报警等.特别是移动互联网的带宽从2G.3G.4G一路发展提升,对移动监控的发展起到了关键的助力作用. 一.概述 移动监控在百度中的定义为:移动视频监控是移动视频图像在前端采集方式为动态形式:后端为传统安防行业紧密结合的专业级监控产品,可移动方式进行接收如:通过手机或电脑能