谷歌正在开发一种即便在离线状态下也能在智能手机上使用的语音识别系统。
谷歌已经在准确度不受影响的前提下缩减了语音库的规模,让该系统能够在处理器和内存资源均比较有限的智能手机上运行。
随着Google Now和Cortana等语音识别系统变得越来越成熟,智能手机用户在出行或者驾车时也可以更迅捷地与他们的移动设备互动。
但是Google Now和Cortana都需要连接互联网,如果没有可靠的网络和数据计划,它们就无法使用。
安装在智能手机上的应用只是连接谷歌、苹果或微软服务器上运行的语音服务的一个接口。这些语音识别系统的工作原理是:智能手机先将用户语音数据收集起来,然后通过互联网发送到服务器上进行处理和分析,一段时间之后服务器会将处理结果发会智能手机并让手机做出相应的反应。
用于分析用户语音的算法极其复杂,不可能在手机有限的硬件上运行。如果能够精简服务器需要处理的数据,整个过程的速度就会加快,这样就会让整个系统的速度加快,同时节省手机上占用的存储空间。这就会让整个语音识别过程更加流畅,但是不管怎样,手机连网仍是一个不可缺少的条件。
谷歌已经开发出一种全新的解决方案。它在研究论文中解释说,它可以将语音识别算法压缩到能够安装到一部智能手机之中的程度,它不但可以有效运行而且不会消耗大量的计算能力。
这个新版本的Google Now语音分析系统比现在公司服务器上运行的系统小10倍。
谷歌已经在Google Nexus 5上测试了这个新版本语音分析系统,使用速度比连网的原版Google Now快7倍。新版本系统已经能够识别从谷歌搜索中提炼出来的300万个匿名语音样本。
研究员们发现,新版本语音识别系统的出错率为13.5%,比连网版Google Now的出错率高出5个百分点。虽然还有待改进,但是这样的结果足以证明这个设计是可行的,这说明智能手机很快就能承担起自行处理语音指令的工作。
在不远的将来,这两个版本的语音识别系统可能会合二为一,整合各自的优势。如果能够将离线版语音识别算法加入Android系统,那么智能手机用户即便在无法连网时也能使用语言识别功能,只是准确度会稍微降低一些。
这样,在办公室或者家中的时候,用户可以选择使用传统的连网版Google Now,而在没有稳定网络的环境下,则可使用离线版Google Now。
研究论文中描述的离线版Google Now具备了连网版Google Now的所有功能,除了字典被精简和准确度有所降低之外,它的功能与连网版Google Now完全一样,比如它也能提供语音定制和错误检测功能。
虽然离线版Google Now尚未正式推出,但是预计它将在未来的某个时候出现在Android平台上。
本文转自d1net(转载)