斯诺登泄密各种美国国安局(NSA)的“黑科技”之后,米国人民似乎意识到了无论什么样的通信方式都逃不过来自政府的监控,NSA甚至早在40年前就可以识别语音了。
语音识别技术可追溯到20世纪70年代
要想更好的理解这是怎么一回事,就要追溯到20世纪70年代:当时美国国防高级研究计划局(DARPA)首次出资研究语音识别技术,在此阶段有好几个项目都可以将语音转换成文本格式。尽管当时的进程很缓慢,但是,通过技术的不断提升,识别的进程变得越来越快,获得的数据也越来越多。
DARPA信息创新办公室主任Dan Kaufman称:
将语音转换成文本的方法是非常困难的,因为通话中往往会有很多其他的噪音信号干扰,我们不是很擅长排除这类的干扰,但是我们也正在慢慢的擅长翻译这些信息。
2001年之后,对间谍工具投入的资本有了显著的增加,从斯诺登文件中甚至可以发现,十年前NSA分析师对“Google for Voice”的诞生是非常开心的。
然而任何工具都不能做到完美的翻译语音对话,至少现在还没有这样的工具;但是不可否认的是当前的一些工具着实很强大,通过大范围的关键词搜索、提取语音对话信息、使用算法标记对话等方式使得翻译更加的准确。
斯诺登文件还指出,美国情报中心已经在一些战区(如,伊拉克、阿富汗、拉丁美洲)使用这种工具进行监听了,但是他们却不会监听美国公民的通话信息。也许全球的公民都应该保持警惕了,因为美国情报机构是使用雷达进行活动的,就连美国国会也觉察不到他们的活动。
语音转换工具及其发展史
2001年爆发的一次恐怖分子攻击活动,攻击者就是用类似的工具,以自动化的方式搜集到了大量的语音通信数据。
第一代语音转化工具:RHINEHART
第一代工具叫做“RHINEHART”,首次出现在2004年。NSA一个叫做For Media Mining, the Future Is Now!的内部文件(2006年)中指出:
语音搜索技术可以帮助分析师快速的查找情报内容,并能根据情报内容优先拦截部分通话。RHINEHART同时支持实时搜索和回顾搜索,这样一来分析师们即可查到当前的通信信息,还可以查到过去的通信信息。
2006年的时候RHINEHART就能够在多种语言中进行翻译了。其中西班牙语在转换中的准确率最高。
第二代语音转化工具:VoiceRT
2009年,VoiceRT开始出现,首次用在巴格达地区,它的目标是每天能检索并标记100万份信息。
第三代语音转化工具:SPIRITFIRE
在2011-2012年间又出现了一个新工具,叫做“SPIRITFIRE”。它能处理更多的数据,并且速度更快,在语音-文本的关键字搜索和配对对话转录功能基础之上拥有更加稳健的语音处理能力。
作为一个普通的公民,我们希望相关机构充分尊重我们的权利,严格管理这类工具,并立法保护我们的隐私。
原文发布时间为:2015-05-09
本文来自合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号