语音的未来:终端标配,能听会说

3月22日,何玺受邀参加了">科大讯飞在国家会议中心举办的新一代“语音云”发布暨语音开发者大会,聆听了柳传志、李开复、科大讯飞董事长、总裁刘庆峰等语音先驱对语音知识的分享,学了不少东西,这里和大家一起分享一下。

发布会开始,科大讯飞董事长刘庆峰对科大讯飞的技术和取得的成绩向与会者做了介绍。

据科大讯飞董事长刘庆峰介绍,科大讯飞经过一年多的发展,目前开发伙伴数超3100家,终端用户数已达3000万,日在线用户超120万,总请求量超700万次。刘总表示,语音技术未来将成为每一台终端设备的标配功能,使得终端具备能听会说能力,这些设备包括手机、家电、轿车,甚至玩具。

据刘庆峰介绍,科大讯飞的语音识别准确率已经达到90%以上,在合成语音发音的自然度以及语音语义理解方面都达到了实用水平,并且支持中、英、俄、日、法等多语种。

另外,刘庆峰还介绍了科大讯飞语音技术在安全、教育、音乐、电信等方面的应用。比如口语评测技术已经达到了国家语委鉴定达到的使用水平,目前已经有5000万师生在使用;而基于音乐评测技术,科大讯飞推出了爱吼网,供用户进行演唱测试。

刘庆峰如是介绍新一代科大讯飞“语音云”:“在已有的语音合成、语音搜索、语音听写能力的基础上,进一步增加了自然语言理解、个性化语音识别、个性化语音合成等新能力特性。”。

在发布会互动环节,柳传志和李开复跟主持人和大家一起分享了对语音发展的看法。

作为讯飞产品的投资者和使用者,柳传志现场给讯飞语音输入法做起了广告,不过他也认为,虽然讯飞目前做得已经很不错了,但还需要继续改进。他指出了讯飞目前存在的一些不足,比如在向讯飞口讯发出口令时,生僻词与发出口令者的口音讯飞识别不是很好。

作为语音技术的研究者,李开复对讯飞现今的语音技术表示还不错。但他认为,语音理解想对较容易。但是语义理解才是语音技术的难点。他认为讯飞语音平台非常好,随着越来越多开发者的参与,越来越多用户的使用,语义理解能力将会越来越准确。

李开复认为,语义理解技术仍然面临一些挑战。 “假如能做到一定程度的语义的理解,需要投入多少,怎么样让开发者很好的介入,这是一个问号。”另外,语音的交流会带来用户期望值的提高,“人们一旦开使用语音跟机器交流了,就会把它当做一个人,这个带来的超级高的期望值会给语音带来很大的挑战。”

 李开建议开发者先从对语义理解要求相对简单的应用入手开发,或者没有语义的应用,比如输入法;娱乐应用,比如游戏、Siri,出错不伤大雅;眼忙手忙时会使用到的,比如驾驶助手;触屏输入太慢的或等不急的,如驾车路线,记事簿;本地商务和地图,如找餐馆等。

李开复在会后在微博继续阐述了自己对语音发展的看法。“【手机语音识别应用的挑战和机会】1)精准度:讯飞这样的平台,利用了大量语料和服务器,可以做得不错,2)语义:语义要比语音更困难,而且不是标准API用上就可以解决的,3)应用:挑选真的需要语音的应用(比如说眼忙手忙应用),4)用户体验和期望:深度结合语音语义和应用,才能做出优质的应用。”
    会后,何玺下载了讯飞的新产品—讯飞语点,使用了它的拨号服务、点歌服务、发短信服务,应用打开服务,感觉不错。建议android用户下载一个试试。

所有的智能终端都能听会说?那将会对我们的生活有什么样的改变呢?令人期待的科技啊!

时间: 2024-08-03 01:50:54

语音的未来:终端标配,能听会说的相关文章

智能语音成家电前沿标配 做成中文 Alexa 的三个关键点

3月初,2017年AWE在上海落下帷幕,人工智能技术成为其中最大亮点,家电智能化已经从最初的"联网"和"APP化"逐渐转向语音.图像.手势控制,智能化程度明显升级. 2016年,人工智能迎来第三次爆发,而智能语音作为AI技术中成熟度比较高的产业已经实现了从技术到产品的真正落地.从亚马逊Echo到谷歌GoogleHome,从美国CES到中国AWE,智能语音已经成为智能家居中产品的前沿标配. 亚马逊Alexa以开放的生态,令Echo对用户的反馈日益人性化,成为众多智能硬

百度吴恩达:语音搜索未来将占百度搜索的50%

腾讯科技讯 美国当地时间12月2日,全球移动互联网大会硅谷站(GMIC SV 2014)在旧金山开幕.百度首席科学家吴恩达就"深层学习"发表主题演讲.吴恩达谈到,深度学习呈现环形生态链,囊括产品.数据和用户三大要素,借此打造神经式网络(Neural network).百度基于此也推出了深度学习产品,比如语音识别和图片认知搜索.吴恩达表示,深度学习主要包含语音.图片.文本三种形式.目前10%的百度搜索是语音搜索,9月百度还发布了语音智能硬件cool box.他 认为电视遥控器未来将消失,

如何在实时语音和实时视频时,监听通话的状态?

问题描述 如何在进行通话时监听通话的状态?我看SDK 里有个枚举,是表示 实时通话结束原因 的 .我打算在回调里用sw 做判断,检测到通话结束时,将页面dismiss回去.但是会出现 通话还未结束,页面已经回去了,但是通话还在继续.这种情况.大神帮忙看看代码有没有问题下面附 回调里的代码- (void)callSessionStatusChanged:(EMCallSession *)callSession changeReason:(EMCallStatusChangedReason)reas

百度语音技术开放加速 二期SDK让手机真正听懂用户

中介交易 SEO诊断 淘宝客 云主机 技术大厅 近日,百度公司面向开发者发布语音二期SDK,不仅增加了语义理解功能,让系统能真正的听懂用户的需求,还提供了更加灵活强大的API接口,帮助开发者更好的完成语音服务接入.此前,百度正式开放语音识别技术,提供包括跨平台的SDK.服务控制台等语音识别的底层技术系统供开发者使用. 业内人士分析:"语音交互技术是需要一个长期积累的专业技术领域,对于开发者来说,有着难以逾越的技术门槛,百度语音识别技术的开放解决了开发者的困难."通过与百度语音合作,直接

AI 吓尿指数与终端智慧化未来的三大痛点

华为在人工智能相关领域的发展路径选择,也许将直接改变中国 AI+ 时代的产业格局和江湖面貌.对于这句话,有些人能迅速心领神会. 过去几年,AI 已经成为华为的重中之重.新智元在和安卓绿色联盟.中科院自动化所合办的 6 月百人会闭门论坛上,特别邀请到华为 CBG 软件工程部 VP.终端智慧工程部部长张宝峰做了专门的讲解.张宝峰 1998 年加入华为,在信息科技领域有超过 18 年的工作经验,目前负责华为终端 AI 软件的开发和交付.他说:"对于手机终端智慧化的未来,我谈谈我的认知和理解,大家可以看

微信小程序未来怎么样?听微盟卫晓祥来说说

微信小程序宣布公测已经一个多月了,开发者一片火热,未来会怎么样?听微盟卫晓祥来说说.微盟移动营销事业部总经理卫晓祥表示,微信小程序最吸引商户的地方在于:一方面小程序作为一种全新的连接用户与服务的方式,可以在微信内被便捷地获取和传播,另一方面,通过微信提供的框架.组件及API,使其具有出色的使用体验. 小程序打造微信生态系统 尽管微信尚未公布小程序的具体入口,但卫晓祥认为,小程序的流量分发.推广都将成为不可忽视的市场,未来或将形成"朋友圈广告+小程序"的新生态模式,小程序将成为商户流量的

云知声黄伟:未来谁能成为 AI 领域的 BAT

以下是黄伟演讲实录. 大家下午好!今天前面杨总(新智元杨静)说了雾霾天出来做这样的交流其实都是真爱,前面二位老总介绍的一些微软包括海尔做的事情,我非常高兴的一点是,我们选择的方向都是对的,都是这个行业里面共同做的方向.今天我分享的题目是--构建AI生态,技术和商业应该是一个良性循环. 为什么选择这样一个题目?首先我们是一个创业公司,做任何技术最终都要去面对商业市场.我本人做云知声之前有一段商业上没有走完的经历,我做过一个 APP,后来大家问云知声为什么不做 APP?不用谈论这个问题,我一直有一个

去哪儿App接入百度语音 用户“说去哪儿就去哪儿”

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 不久前,去哪儿旅行APP加入语音功能,用户只需要对着手机说话,即可完成旅游出行搜索和预订.该功能是去哪儿旅行与百度语音共同打造的智能语音产品,标志着百度和去哪儿在语音技术领域再上一层楼,"只动嘴不动手"的智能化,让用户"说去哪儿就去哪儿". 去哪儿无线高级产品总监杨昌乐说:"与百度语音的合作,

赢在未来,英特尔豪赌中国

如今,IT和互联网已经进入我们工作生活的每一个角落,我们使用着各种高科技设备,对英特尔.苹果.谷歌.微软这些公司耳熟能详. 而事实上,人类发明第一台电子计算机才不过短短几十年.在这几十年的历程中,我们看到了一家家明星公司的兴起.从巨型机时代的IBM到小型机时代的DEC,从PC时代的英特尔.微软到移动时代的苹果.谷歌,在每个时代都会崛起一批能够迎合时代的明星公司. 英特尔的崛起在PC时代,移动时代苹果.谷歌和ARM抢到了先机,如今智能手机和平板已经饱和,苹果从2007年发起的移动革命已经接近尾声,