语言是人与人之间最重要的沟通方式,也是民族识别的基本要素之一。中国是一个多民族、多语言、多方言的国家,大多数民族都在使用两种或两种以上的语言进行交际和沟通。
智能语音技术被誉为未来信息技术和人机交互领域的十大科技发展技术之一。中国互联网巨头百度、腾讯微信跟随这一潮流,先后对外开放语音识别技术。语音应用出众的体验令人印象深刻,但识别效果易受不同的说话人、口音以及环境噪音的影响。就中国市场而言,复杂多变的方言是首要解决的问题,如何让机器“听懂”不同地区方言,并非易事。
我国有七大方言区,不同的方言区孕育出了不同的民族文化。想要更好地了解风土人情、剖析民族历史最好的捷径就是从方言入手。如今,方言文化和学术价值已经得到了社会各界的关注,引发国家语言文字工作委员会的高度重视,在“推普”同时不断加强研究、保护和传承方言。
需要指出的是,我国方言语音领域的研究还是一方热土。科大讯飞作为亚太地区最大的语音上市公司,一直致力于智能语音核心技术的研究和开发。日前,公司对外发布了东北话语音识别技术,不仅能够识别东北口音普通话,对纯正东北官话(包括沈阳话、长春话、哈尔滨话)均有很好的识别能力。其东北话语音识别技术不仅准确识别声音信号,将其转写成对应的文字内容;还能深入理解东北话表达的意思,反馈出文字或语音指令。
除了东北话识别外,科大讯飞自主研发的方言语音识别技术已经支持粤语、四川话、河南话多地方言,并率先应用于讯飞输入法中,用户可直接使用输入法在聊天场景语音输入,也可在其它应用中使用语音转文字。截至目前,讯飞输入法的方言识别普及约4.4亿人。
事实上,自讯飞输入法发布方言识别以来,用户使用语音输入更加频繁,普遍认为方言识别能够显著提升与智能终端之间的交互体验,相比文字手写更愿意选择语音输入。例如,以前在语音发短信时,一方面刻意纠正口音说普通话,一方面担心说得不标准导致不能识别或者不正确,说完还要多次修改;有了方言识别以后,现在说话发短信更轻松自如,用户可以把更多的注意力放在沟通中而不是耗在输入环节。另外,对方言接收者而言,能倍感亲切。
当然,科大讯飞并不是唯一一个对方言语音领域抱有雄心的公司。国外的苹果、谷歌、Nuance等都专注于多方言、多语种智能语音领域的研究,由此切入寻找更大的发展空间,可在未来市场中处于领先地位。在不久将来,人们将精确的语音识别技术完整集成智能电视、机顶盒、车载车机、可穿戴设备等在内的智能设备中,完全抛弃现有显示屏和触摸屏设备,实现随心所“语”。