日前,中文语音产业的领跑者科大讯飞也启动了新一代“语音云”平台发布暨语音开发者大会(详情请点击:http://2012.voicecloud.cn)。此次发布的新一代“语音云”平台将是一个具有自然语言理解、个性化语音识别、个性化语音合成、声纹识别、口语评测能力等特性的新一代“语音云”平台。今天就让我们一起来了解这五大特性究竟为何物?
自然语言理解
自然语言,即人们用最自然的说话方式说出的语言。自然语言理解,作为一个新的特性出现在新一代“语音云”平台中,在现有的移动互联网案例中,我们只能想到苹果的siri,无需拘泥于说话方式的智能语音操控。作为先行者,Siri成功地引爆了移动互联网语音的这颗炸弹,掀起了语音应用的高潮。若新一代“语音云”被开发者或硬件厂商广泛应用于各种应用和手机等设备中,那必将是移动互联网的一次新的革命。在现有的移动互联网应用中,我们不乏看到类似的应用如Airi、智能360等,其都有通过语音对话的方式进行打开应用、查询天气甚至“调戏”的功能,但是识别及回答的效果并不理想。我们更期待一个官方版的“自然语言理解”功力到底如何。
个性化语音识别
个性化的今天,语音也可以玩个性化。在现有的语音云平台中,讯飞仅提供的是标准的普通话识别,对于口音较重的方言,目前还没有一个很好的识别效果。个性化语音识别也许能提供方言识别的解决方案。据悉,新一代“语音云”平台可以提供陕西话、四川话、东北话和广东话的语音识别方案。其实在现有的语音云平台中已经有东北话和粤语的合成功能——塞班讯飞口讯的多语播报功能。除了对方言的个性化语音识别,新一代“语音云”平台还将建立一个个人的语音数据库,数据库收集个人特定的发音信息,可以快速识别具有个人特色口音的语言,即如果它识别不了上海话,你可以通过对它进行训练和指导,让它学会“听”上海话。
个性化语音合成
与个性化语音识别相仿,可以合成不同的方言。这一点在现有的语音云平台中已经实现。进一步的个性化莫过于合成具有个人特色的语音。既然能通过建立个人的语音数据库识别个人特色语音,相信合成具有个人特色的语音基本不是问题,也许哪天你不想动嘴说话的时候,可以找个“替身”替你说了,也许哪天你打电话给你朋友的时候,对方已经变成刘德华或者葛优了……个性化语音合成的意义丰富!
声纹识别
在影视剧中我们常常可以看到这样的情景:大佬来到保险门旁,输密码;手掌按住指纹识别仪,绿光扫过;语音要求说话验证;保险门开了!这样的场景在未来并不是梦。声纹作为唯一一个非接触式的个人特性,在公共安全方面应用方面有着重要的意义。也许有一天,警察破案可以不用采集指纹了;启动汽车不用钥匙了;开保险柜也不用设置密码了……,新一代“语音云”平台的声纹识别特性,为各种应用的加密提供了新一代的解决方案。
口语评测
目前,国家普通话水平测试基本都是采用的科大讯飞的语音评测系统。口语评测功能在生活中的应用已经很成熟了。在新一代的“语音云”平台中,口语评测已经开放,你可以随时随地评测自己的普通话,等你在普通话考试的时候,可以自己在家练习,掌握规律,把握特性,百战百胜。
作为中文语音产业的领跑者——科大讯飞,在智能语音尤其是中文语音方面一直走在国际IT巨头的前面。其2010年发布的首个“语音云”平台产品获得了业界的一致好评,目前讯飞语音云的开发伙伴已经达到了2500多家,终端用户数已达2500万,每天在线用户数已超过120万、总请求量超过700万次。新一代“语音云”平台的发布必将是语音发展史上的一件大事。
(责任编辑:蒙遗善)