提起科大讯飞,毫无争议是国内语音技术界的金字招牌。依靠相对深厚的技术储备和广泛的合作关系多年来一直领跑行业,目前可以说是三分天下有其二(70%的中文语音技术市场份额)。就在昨天的一场小型媒体交流会上,讯飞向我们展示了其最新的离线语音技术。
以往的语音资源库保存在云端,应用在提取音频特征后上传云端处理。而离线语音将资源库下载到本地,在弱信号或无信号环境下也可进行高精度的语音识别和输入。由于在资源占用和识别精度上的技术矛盾,目前在该领域推出成熟产品的公司屈指可数。
据统计,中国只有 26.1% 的手机用户接入 3G 网络,许多用户仍然处于流量敏感的状态。而讯飞的离线语音包仅有 15M 到 30M 大小,对不同性能的设备会自动在语音包体量上做出适配。再加上离线语音不受网络延迟的影响,对用户体验会带来较大提升。目前讯飞离线语音的中文识别准确率可以达到 85%,识别速度 300ms,两项指标相比 Google 均有一定优势(据称 Google 的 Offline Voice Typing 中文识别率不到 40%)。基于特定语言模型的分析,讯飞也可以实现长句语音输入和自动标点,用户无须再对文本频繁修改。另据小米官方消息,讯飞离线语音已被小米3采纳。
值得一提的是,讯飞的个性化语音识别也将应用在稍后版本中出现。系统会为用户数据建立个性化资源库,通过个性化资源的动态加载、融合使得语音智能更加“聪明”。
离线语音不是个新鲜名词,Google 在去年发布的 Android 4.1 版本中就已经应用了此技术,而据媒体此前报道,苹果即将推出的 iOS7 也具备这一功能。
时间: 2024-10-01 18:01:32