Siri开发商推出普通话应用:声调成识别障碍

与Siri同根同源的Dragon能够支持普通话  导语:美国《商业周刊》网络版周三发表署名为凡妮莎·王(Venessa Wong)的分析文章称,除了开发苹果语音助手Siri外,语音识别软件开发商Nuance Communications还推出了智能机语音应用Dragon,支持多种语言。由于中国的普通话使用声调区分发音,这为Dragon的语音识别带来了难度,虽然不能达到完全准确,但基本上还算不错。  以下是文章全文:  在期待苹果今年推出中文版Siri的同时,我决定尝试一下Nuance的另一款智能机应用Dragon,它支持多种语言,其中就包括中国普通话。  虽然中文版Dragon和其它多数语音识别软件一样不能达到百分之百准确,但从基本层面来说,还是非常不错的。首先,对于语音识别来说,中文极具挑战性,因为普通话只有400个单音节声音,根据声调予以区别。  比如,妈妈的“妈”这个字读一声“mā”,读四声就成了“骂”(mà),三声在就成了“马”(mǎ),所有这些字读起来都像“ma”,但是声调不同开发一款能够识别“妈妈骂马”(māmā mà mǎ)句子的软件实在不是一件容易事。  尽管普通话是中国的国语,但是中国还拥有很多种方言和数不尽的地方口音。Nuance下属Dragon研发副总裁吉姆·吴(Jim Wu)表示:“在中国大陆,每个人都有不同的口音,其中的一项挑战就是确保系统能够用于口音较轻的普通话用户。”  Nuance总部位于美国马萨诸塞州伯灵顿市,2011财年的营收为14亿美元,他们在2011年3月推出了两款免费中国普通话版Dragon应用,稍晚于Dragon英文版应用。Nuance还在2011年6月推出了广东话和台湾话版Dragon应用。 Dragon口述(Dragon Dictation)应用可以转录文本、电邮、Facebook或Twitter信息。Dragon搜索(Dragon Search)则用于互联网搜索,但不像Siri一样,Dragon无法向用户进行反馈。  要想使用Dragon,用户需要点击“虚拟按钮”来开始和停止录音。所有过程都在服务器端处理。Nuance首席营销官皮特·马宏(Peter Mahoney)称,Dragon口述过程将上传至服务器中,由后者进行倾听、录制,然后将文本发回至设备上。  我口述了一些基本语句,比如“最近的星巴克店在哪里”,“我要去市场”等,这些对于Dragon应用来说都没问题。但是对于大部分用户来说,真正的乐趣在于测试设备的认知限制,看看它究竟能够多少匹配人类的语言和想法。  所以我用中国式绕口令来挑战Dragon的极限,“妈妈骑马,马慢,妈妈骂马”,该句的发音就是“Māmā qí mǎ, mǎ màn, māmā mà mǎ”。Dragon能够捕捉大部分语音,但并不总是准确。Dragon显示的结果是“妈妈起码,妈妈,妈妈吗吗”,这里存在的一个基本问题就是无法准确识别“ma”。  尽管还不是完全准确,但马宏表示,Dragon应用还可以自主学习并提高。由于所有语音处理发生在服务器端,所以Dragon收集用户语音数据来学习语言,找到合适的组合词汇。Dragon还可以适应每一位用户的地方口音,适应的越好,语音识别就越准确。马宏还表示:“这些录音将保存下来,这样我们就可以使用自动化工具来分析结果。有时,你需要让人使用录音来看看他们怎样才能做的更好。”(晓明)

时间: 2024-08-22 16:02:13

Siri开发商推出普通话应用:声调成识别障碍的相关文章

京华时报推出了基于移动图片识别技术的“云”报纸

在移动http://www.aliyun.com/zixun/aggregation/3519.html">互联网时代,印刷媒体如何捕捉新技术为我所用?北京的京华时报日前推出了基于移动图片识别技术的"云"报纸. "云"报纸需要一份报纸和一部可拍照的移动智能终端.先下载安装一个"联通亿拍"的应用,激活其中的"我是拍客"功能,就能开启拍照识别程序,然后将摄像头对准京华时报的报头,按下拍照识别键,就能完整地在终端上呈

苹果官方宣布,Siri会将默认搜索换成Bing

摘要: 苹果官方宣布,Siri会将默认搜索换成Bing(必应),原来用的是Google.人们不禁怀疑:必应能提供可匹敌的高质量搜索吗? 不清楚苹果为何与微软达成交易,又是怎样的交易形式.但从合作 苹果官方宣布,Siri会将默认搜索换成Bing(必应),原来用的是Google.人们不禁怀疑:必应能提供可匹敌的高质量搜索吗? 不清楚苹果为何与微软达成交易,又是怎样的交易形式.但从合作来看,苹果可能在寻找办法降低对Google的依赖,甚至不惜与老对头微软结盟 .那么,两家企业能提供高质量搜索吗? 在P

谷歌鼓励开发商推出眼镜应用:目前已确定80款

谷歌鼓励开发商推出眼镜应用:目前已确定80款 2月17日消息,几个星期前,谷歌在旧金山和纽约举行了黑客大会.不过这成为一届"眼镜大会",是围绕谷歌即将推出谷歌眼镜,而举办的一场邀请会. 据国外http://www.aliyun.com/zixun/aggregation/31646.html">媒体报道,一些已经签署了谷歌眼镜开发项目的开发商们可以用两天时间佩戴这个眼镜及使用公司正在开发的应用程序界面(API). 最终,谷歌眼镜确定了其中的80多种应用.谷歌表示,有八个

日本开发商推出体感操作周边对应18禁游戏

(编译/于子将)据海外媒体消息,日本著名成人游戏开发商Illusion日前公布了一款名为<真实的女朋友>的成人游戏,并计划为这款游戏推出成人体感操作周边. <真实的女朋友>依靠摄像头捕捉真实对象的动作和面貌并出现在游戏场景中,然后玩家就可以像对待自己女友一样的去捏她的脸.打她的头甚至是挖她的鼻孔.如果再配合特制的体感操作周边,玩家就可以对其"做自己想做的任何事"了. 据称游戏还支持逼真的3D显示效果,该周边拥有震动功能并有尺寸大小可供选择. 此消息一出,随即也引

Facebook将推出音乐和电视节目识别功能

北京时间5月22日早间消息,Facebook本周表示,即将推出一项 新的移动功能,当用户使用Facebook发布内容时,帮助用户识别正在收听的音乐或正在收看的电视剧.当用户启用这项功能时,如果通过Facebook的iOS和Android应用发送消息,或上传照片和视频, 那么智能手机将探测用户所处环境中的声音.如果你的音响中正在播放某首歌曲,那么Facebook将可以对其进行识别,而用户可以将这一信息加入到当前的状态更新中.此外,如果用户将正在收听的音乐公布在Facebook上,那么好友将可以从动

《愤怒的小鸟》开发商宣布与阿里云达成合作共建平台

[52pk 3月18日消息]开发出风靡全球的休闲游戏<愤怒的小鸟>[下载]的芬兰游戏公司Rovio近日宣布,已与阿里巴巴旗下"阿里云"达成合作,将共同搭建针对中国游戏开发者的HATCH(孵化)平台.由阿里云提供云计算与大数据处理能力,并由Rovio 提供具体的功能搭建与开发,平台预计今年6月底上线. 据了解,这次合作Rovio将通过阿里云共享之前的技术工具,建成集账户体系.推广通路.广告系统.支付界面.游戏发布等功能于一体的综合性游戏开发平台.HATCH平台提供涵盖整个游戏

DOTA6.76c推出 推推人马渐成主流

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   [科技讯]10月29日消息,DOTA近日推出新版本6.76c,新版本的推出主要是针对6.76b中的半人马酋长.人马不仅技能imba,力量成长也打败大树.末日.蓝胖等传统高力量成长英雄,一跃成为全DOTA力量成长第一英雄.如果再不修改,DOTA中的法师们就快没法活下去了. 小编在11天梯RD房亲身体验了一局人马,一局下来感受颇多.首先第一感觉,肉啊!是真肉,如果再

郭台铭坐钓夏普如何收官 巨额亏损成新障碍

好事多磨. 一场期待中的签约,历时8个月迟迟未能举行.一边鸿海(2317.TW)董事长郭台铭稳坐"钓鱼台":另一边,迟迟没有"咬钩"的夏普(6753.TO)甚至已于7月将其日本总部及主要工厂抵押,换取银行新追加的1500亿日元贷款. 这是夏普可用于抵押的最后资产,开了日本大型电子制造商将总公司和主要工厂都作为担保融资的先河.但此后的8月和11月,夏普连续两次将2012年的净亏损预期进行调整,4月份预期全年净亏损300亿日元的额度猛增至2500亿日元,再到4500亿日

21家上市公司分拆子公司登陆新三板 血统成挂牌障碍

新三板正散发出越来越迷人的魅力.今年1月份,新三板全国性扩容后,挂牌公司已超1000家.日渐人气兴旺的背景点燃了上市公司逐鹿新三板的热情,众多上市公司控股或参股公司纷纷在新三板挂牌.上市公司力推子公司挂牌新三板的目标各异,或为融资,或为完善治理结构,或为股东退出,不一而足.不过,可以预见的是,上市公司将会越来越多地参与新三板扩容,推动子公司挂牌新三板. 自扩容以来,迄今超过1000家企业登陆股转系统.无数的私募基金.投资机构.实力强劲的个人投资者纷至沓来,原先寂寥的股转系统一下子充满了人气.21