如果你的手里拥有一台iPhone,同时你也会说一口正宗的四川方言,不妨拿起你的iPhone用正宗的四川话对 Siri 说:“放心巴适得很绝对正宗 ”,如果是来自美国的Siri,那它肯定听不懂,虽然它听得懂粤语。在现实生活中,不仅是 Siri,市面上所有的语音助手类产品,几乎都没有听得懂四川话的。不过这一现象将很快让科大讯飞改善,这家企业已经发布了四川话语音识别技术。
国内目前做方言识别技术的公司寥寥无几,其中最大的原因就是国内的方言种类实在太多,若要做方言识别技术就需要建立起不同的识别模型,而且各个地方的方言缺乏足够多的语料,语音识别引擎也训练不足,导致识别准确性并不高。所以人数比较多,或者是范围比较广的方言久能够优先得到解决,粤语就是一个好例子。
科大讯飞的解决办法是先通过深度神经网络等技术,开发出一个方言语音识别引擎,用来方言口音适配。在开发出引擎的同时跟国家语委合作,征集到足够多的方言语音数据来训练识别引擎,通过大量的预料训练,提高方言识别的准确性。科大讯飞称,他们开发的四川话语音识别引擎,识别准确率已经超过 85%。
据科大讯飞向透露,四川话语音识别技术将率先应用于输入法产品,很快将发布支持四川话语音输入的讯飞输入法将。此前讯飞输入法已经支持普通话、英语、粤语语音输入。除了手机输入外,方言音识别技术还是有比较丰富的使用场景,例如语音驾驶导航、智能电视、可穿戴设备都用得上;甚至还可以成为教育教学、考试考评的公众平台;另外,在聆听京剧、川剧、昆曲、黄梅戏等戏曲时,提供普通话意思“翻译”......
虽然不像普通话这么有普世意义,但四川话总是有非常独特的魅力。而且据不完全统计,在全球大约有 1 亿 2 千万人说四川话,是一个非常庞大的群体。而且随着智能语音技术的普及,非要让四川的同学说普通话才能够享受到,这是非常不科学的...... 所以干脆研发四川话语音识别技术来得比较实在。
除了四川话,科大讯飞正在研发的东北话、上海话等方言语音识别技术也将在年内陆续发布。