百度语音技术开放加速 二期SDK让手机真正听懂用户

  近日,百度公司面向开发者发布语音二期SDK,不仅增加了语义理解功能,让系统能真正的听懂用户的需求,还提供了更加灵活强大的API接口,帮助开发者更好的完成语音服务接入。此前,百度正式开放语音识别技术,提供包括跨平台的SDK、服务控制台等语音识别的底层技术系统供开发者使用。

  业内人士分析:“语音交互技术是需要一个长期积累的专业技术领域,对于开发者来说,有着难以逾越的技术门槛,百度语音识别技术的开放解决了开发者的困难。”通过与百度语音合作,直接为开发者的应用增加创新的语音功能。同时,语音功能化繁为简,也令开发者更加专注自己应用的开发工作。

  

  (去哪儿旅行App的百度语音功能界面,用户只需要对着手机说话,即可完成旅游出行搜索和预订。)

  语义理解令用户使用更顺畅

  此前,百度语音第一期SDK向开发者提供了长文本语音输入、语音搜索词识别,垂直领域识别等多方面的语音识别服务。并且支持“即说即得”技术,确保了用户体验的连贯性。在第一期百度语音SDK发布时,百度相关负责人曾表明将逐渐开放语义理解和TTS(语音合成)等多项面向开发者的服务。现在,第二期的百度语音SDK即携带语义理解功能姗姗而来。

  语义理解即是对语义的理解能力,让机器能够理解我们所说的话。简单的理解就是,让机器学会人类的说话逻辑。 例如:“下载百度手机助手”这条指令, 通过语义理解模块的处理, 即被理解为, 用户的目的是下载App, 名称是“百度手机助手”。百度相关负责人称:“ 语音识别加上语义理解模块, 可以为开发者构建自然语言交互能力,让手机真正听懂用户,并执行用户想要的操作。”

  据百度相关负责人介绍:“语义理解目前已开放包括天气、航班、地图、社交网络、手机设置、音乐、旅游等垂直领域。基本覆盖了目前主流的手机应用领域,未来百度语音还将对这些领域进行更深度的优化。”

  百度语音SDK二期不仅具备强大的语义理解能力,还为开发者提供了更强大的API接口。最新的API接口支持开发者传入第三方语音数据,可将已经录好的语音数据识别为文本,以备后续调用。另外新的API接口还支持语音数据导出功能,可将用户所说的内容录入并通过回调函数返回给开发者,方便开发者分析和收集用户行为。

  百度相关负责人表示:“第一期的百度语音SDK更多的是为了满足语音输入场景需求,第二期的SDK则是对语音交互的补充。使得开发者的语音交互更加智能,同时也提高了产品的执行率和可扩展性。”

  二期语音识别率持续提升

  语音识别率是衡量一款语音产品的重要指标,一款好的语音工具,需要有非常良好的语音识别能力,尤其我们的国家拥有非常复杂的语言环境,语音识别率更是考量一款产品好坏的硬性指标。百度语音识别率有着超越DNN技术的更贴近人类听觉认知系统的新型识别技术,带来语音输入相对错误率下降20%以上,近期还将持续提升。

  世界语言中最难学的当属汉语,其复杂程度自不言而喻,加上各地方言和不同地域说话方式的不同,所以针对中文的语言识别的优化更是难上加难。百度相关负责人表示:“百度语音自成立以来,一直在不断优化语音识别能力,通过两年的攻坚和积累,百度语音识别率目前已经是业界领先水平。”

  语音识别率提升是通过大量的语音运算,语言整理和长期以来百度语音开发者及用户对百度语音产品使用调教出的结果。一位资深用户表示,他每天都会尝试通过百度语音助手与手机沟通,磨合自己与手机的沟通,以提高语音执行能力”然而这些成果百度通过新一期的SDK全部共享,并且依然秉承产品发布时承诺的永久免费模式,提供给开发者使用。

  业界人士表示:“语言积累需要时间和周期,针对语音识别率的积累还要漫长的过程,希望百度语音能够在这条路上走的更稳更快,为开发者提供更优秀的语音产品。”

  做语音开放行业“领跑者”

  百度语音技术一经发布就受到了众多移动开发者的一致好评,同时百度语音也收获了第一批合作伙伴。目前与百度语音合作的终端厂商包括:小米、魅族、中兴、金立、康佳、飞歌导航、冠捷显示器等;互联网企业包括去哪儿、爱奇艺、图吧等。

  小米语音助手便是基于百度语音技术打造,双方通过深度定制合作实现了小米语音助手的各项功能,并且通过小米语音助手还能实现与小米手机操作无缝结合,实现对小米手机的特定操作。

  “百度语音第二期SDK的发布,是百度对整个语音行业的成功“定调”,标志着以后的语音行业将走向开放、合作之路。更象征着百度语音从“行业领跑者”到“生态构建者”的成功转型。” 一位应用开发者说。

  事实上,用技术去支持开发者的发展,一直是百度长久一直以来秉承的政策。李彦宏将百度语音技术称作“平台化和接口化的典型”。平台化揭示了百度开放战略是以技术平台服务开发者;接口化,则说明百度选定了以输出技术为搭建平台的路径。

  对于追求长期发展的开发者而言,语音之路永远是一条开放之路。同样开放的心态也会促进语音行业的快速前进。

  附

  开发者想要接入百度语音SDK请登陆:

  http://developer.baidu.com/wiki/index.php?title=docs/cplat/media/voice

时间: 2024-09-13 18:56:15

百度语音技术开放加速 二期SDK让手机真正听懂用户的相关文章

亚马逊宣布已收购语音技术公司Ivona 或为推手机准备

亚马逊收购Ivona展示了该零售巨头在智能手机领域的野心?http://www.aliyun.com/zixun/aggregation/6149.html">TechWeb配图 [TechWeb报道]1月25日消息,据国外媒体报道,亚马逊周四宣布,公司已经同语音技术公司Ivona达成收购协议.收购案的具体信息并未对外透露. 亚马逊同Ivona公司的收购协议虽然刚刚达成,但是两家公司的合作早就开始了.亚马逊8.9英寸Kindle Fire HD上的"文本转语音".&qu

去哪儿App接入百度语音 用户“说去哪儿就去哪儿”

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 不久前,去哪儿旅行APP加入语音功能,用户只需要对着手机说话,即可完成旅游出行搜索和预订.该功能是去哪儿旅行与百度语音共同打造的智能语音产品,标志着百度和去哪儿在语音技术领域再上一层楼,"只动嘴不动手"的智能化,让用户"说去哪儿就去哪儿". 去哪儿无线高级产品总监杨昌乐说:"与百度语音的合作,

百度第四届技术开放日 大数据是主角

在近日举行的百度第四届技术开放日上,百度董事长兼CEO李彦宏表示,技术创新是一个从量变到质变的过程.随着互联网的发展,大数据当前已走到技术变革的临界点. 李彦宏表示,互联网在改变着中国.而未来的一个趋势,则是技术将在很大程度上改变互联网,因此必须及早对http://www.aliyun.com/zixun/aggregation/5739.html">互联网技术进行研究和布局.从目前看,并行计算能力不断提升和云存储等技术产品成本的不断降低,使大数据真正走到了技术变革的临界点.百度在会上正式

集成百度语音sdk到智能家居平台中

今天,周六,晚上有约会.不过有些任务必须逼迫自己赶紧完成.要构造一个完善的系统不是三天打鱼两天晒网能够完成的,必须严格按计划执行下去,持之以恒.终有一日会形成规模效应.做Demo很容易,做产品,很难. 百度SDK的集成在它 的官网有完整的教材. 1 申请,你首先需要通过百度的验证,给你开放. 2 集成,集成分为深度定制和使用百度提供的UI快速集成. 具体step-by-step的东西,参考它的手册即可. 我这里只记录一些个人认为有价值的东西. 1 语义理解 "SDK 还支持语义理解能力,可以将用

百度语音助手下一个版本将开放第三方资源引入

[http://www.aliyun.com/zixun/aggregation/6149.html">TechWeb报道]1月30日消息,今天的百度媒体开放日上,百度移动产品副总监李东旻表示,百度下一个版本将开放第三方资源引入. 百度语音助手将语音识别与语音播报能力开放给第三方开发者,让用户在语音助手内,通过语音的交互方式,使用第三方提供的功能和资源. 李东旻演示了通过百度语音助手"调戏小黄鸡",此功能便是与韩国的simsimi公司合作,在百度语音助手内直接使用小黄鸡

Android 基于百度语音的语音交互功能(推荐)_Android

项目里面用到了语音唤醒功能,前面一直在用讯飞的语音识别,本来打算也是直接用讯飞的语音唤醒,但是讯飞的语音唤醒要收费,试用版只有35天有效期.只好改用百度语音,百度语音所有功能免费,功能也比较简单实用,包括语音识别,语音合成和语音唤醒,正好可以组成一套完整的语音交互功能. 效果图: 首先是语音唤醒功能,说出关键词即可叫语音识别,唤醒成功会有语音提示,这里采用了百度语音的合成功能.然后百度语音识别会根据wifi情况自动切换在线或者离线识别,但是离线识别只能识别已经导入的关键词,而且离线第一次识别需要

人工智能时代,语音技术怎么赚钱?

雷锋网(公众号:雷锋网)按:本文由DeeperBlue发布于雷锋网.转载请联系授权,不得删减内容. 半个月前的锤子手机发布会让全国人民(包括我妈)知道了一家叫科大讯飞的公司,以及语音智能这件事. 我没有在现场.据说老罗向观众们介绍了锤子的主要合作伙伴科大讯飞的一款产品--讯飞输入法.老罗用很快的语速说出一大段长文字,讯飞做到了无时差翻出文字版本,并且识别结果几乎没有任何偏差,堪称完美,现场一片欢呼. 讯飞输入法支持 19 种方言输入,相比苹果的 Siri,以及微软的 Cortana,讯飞输入法显

百度世界着眼“开放”400位联盟会员代表参加百度世界

每一届的百度世界大会都会在行业内掀起巨大波澜,为互联网行业带来新鲜的技术趋势和发展理念.2010年9月2日,百度世界2010大会在北京中国大饭店正式拉开序幕,正如大会"创新.开放.共赢"的主题一样,百度创始人李彦宏对"框计算"延伸出来的开放数据及应用平台进行了深度解读,这意味着第三方应用开发商将在接下来的互联网第二波浪潮中成为主角,无论是独立的应用提供商,还是百度联盟体系下35万合作伙伴,都可以接入百度这一开放平台,并从中受益,推动中国互联网行业创新发展. 记者发现

对百度语音搜索的一点想法

当我们还在PC端拼命的敲字搜索的时候,百度已经在移动端开始提供语音搜索了.对于手机而言以声音的方式提供搜索查询更便捷,毕竟手机上敲字的方便性无法和电脑的键盘相比.百度的语音搜索带来的是一种全新的感受,它实现我们从文字输入搜索到语音输入的转换,虽然是在移动平台上开始使用的,但是不得不让我们憧憬未来的全新搜索方式. 多元化搜索更符合用户要求 如果说百度的文字搜索很强的话,那是大家公认的.但是对于语音搜索来说,大家的起跑线应该是差不多的.百度能够率先成功推出该产品,首先是要满足用户多元化搜索的需求.这