海天瑞声做智能语音界的“幕后英雄”

 不知从什么时候开始,人类已经迈入智能时代,机器变得更加“贴心”,能对人类行为有所感知,让人类生活变得丰富多彩起来。智能时代,人们通过智能语音系统发送简讯、操纵汽车、遥控设备,这一切主要归功于智能语音的诞生。

海天瑞声从1998年进入智能语音行业至今已经有18年的历史。作为中国最早进入到工程化应用语音语料领域的资源供应商,海天瑞声可以提供110多种语言、覆盖全球75个国家和地区的语音语料数据的采集和人工转写标注服务,能够制作45种语言的专业发音词典,图形图像视频音频数据的采集和标注服务之外,还可以根据客户的需要提供一站式的综合数据解决方案,从语料设计,采集,处理,模型训练,语音系统测评测等各个环节的服务,为客户提供全面的解决方案。

“我们公司所做的事情,有点像智能语音产业的‘幕后英雄’,用户看不到我们,却能时时刻刻体验到我们。”北京海天瑞声科技有限公司的市场总监陈清说道。目前市场上的车载语音系统,在悦耳自然的声音背后,就可以发掘到用来训练引擎模型的大规模的音语料库的身影。

人机交互作为智能语音的核心技术,通过相互理解的交流与通信让机器理解人类语言,从而可以让机器听从人类的安排。机器“能听会说”的技术重点主要依靠两方面:一是语音识别(能听)和语音合成(能说)引擎开发的技术成熟度,二是用于训练引擎的训练语料的规模和品质,其中包含语音和文本语料两大类。

人类语言是一个极为复杂的体系,机器对人类语言的理解和识别过程与人类极为不同。在一定程度上,智能语音的两大核心——语音识别和语音合成引擎的开发技术水平已经十分成熟。正因如此,训练语料越来越成为一个提升用户体验的瓶颈。

陈清指出,作为最终用户,对语音识别系统的体验不仅要从它的识别速度,更要从识别的精准度两方面来衡量,这就要求开发者从引擎设计运算能力、网络速度以及训练语料的设计水平等多方面进行不断提升,努力破除用户体验的瓶颈。

语音合成引擎是信息处理领域的一项前沿技术,解决的主要问题是如何将文本状态的文字信息转化为可听的声音信息,使以往只能用眼睛看的文字信息,也可以用耳朵来听。通俗地说,就是让电脑开口说话的技术。

合成语音的自然度和流利度,包括同一句话里的自然停顿,语气正常起伏等能直接感知的指标,与引擎算法设计和语料库,有同等重要的关系。因此,在语料设计方面,就需要考虑到性别年龄口音音色说话速度方言口音等多方面的因素。同时,考虑到成本和计算机运算能力的限制,要用尽可能少的数量覆盖尽可能多的语言现象和发音特点, 这对语料设计者的语言学和语意学的研究积累,也是一个很大的挑战。

未来海天瑞声还将推出的中国最大智能语音数据资源平台——天籁数据中心,面向全球科研用户,提供免费或极低收费的高品质科研数据,支持智能语音及相关人工智能领域,如自然语音理解,机器翻译等人机交互技术的科研,测试和模型训练的需要。  

原文发布时间为:2015-7-14

 

本文作者:孙博

时间: 2024-09-25 02:34:27

海天瑞声做智能语音界的“幕后英雄”的相关文章

为什么小小的智能语音开发板引起全球巨头的关注?

麦肯锡<人工智能,下一个数字前沿>报告中,不意外地,语音领域被麦肯锡重点划线了. 报告估计2016年,AI的年度外部投资总额在80亿美金到120亿美金之间,其中机器学习占了近60%的投资.机器人和语音识别是两个最受欢迎的投资领域,投资占比如图所示.此外,报告中在解释人工智能(AI)的投资在世界领先的科技公司之间引起专利和知识产权(IP)的竞赛时,也引用了很多亚马逊对机器人和语音识别的投资案例. 亚马逊对语音方面的部署的确是令世界瞩目的.同时间麦姆斯咨询公司也放出了两则智能语音领域的动向,XMO

【详解】智能语音交互@阿里巴巴

[编者按] 近日,阿里云在 2016年 会上公开展示实时语音识别技术,并现场挑战世界速记大赛亚军得主.据现场最终评测,机器人在准确率上以 0.67%的微弱优势战胜第 50 届国际速联速记大赛全球速记亚军姜毅. 虽然是第一次正式亮相,但阿里云iDST的语音识别系统,已经在阿里巴巴的多个业务场景中应用了.从去年开始,阿里集团与蚂蚁客服每接听一个电话,都会立刻启动一个叫风语者的系统,它就是自动语音识别技术,将语音转变成文字,千分之三的人工抽检可以瞬间升级为100%的自动质检.除此应用场景之外,阿里Yu

AI与大众最近的接触——智能语音交互

互联网的变迁过程 互联网的变迁主要体现在内容.入口.人机界面三个方面. 互联网内容的变迁 图一 互联网内容的变迁 时至今日,互联网的内容已经发生了很多变迁,早期的互联网以获取信息为主,例如人们通过Email收发信息.在BBS上灌水.通过门户网站了解新闻等等.阿里巴巴的起点也是从Alibaba.com开始,最初仅是为国外买家获取信息.购买国内供应商的产品起到牵线搭桥的作用. 随着网络的发展,互联网不仅仅再局限于获取信息,消费者逐渐可以通过淘宝.天猫.聚划算等网站购买生活必须品:现在,除了提供信息和

亚马逊、小米、联想 各路大咖为何都跨界做智能家居?

不知道从什么时候开始,智能家居这个原本只在科幻电影中见过的概念已经逐渐深入了我们的生活,远距离遥控灯光.智能感应温度等,这些功能都已经确确实实地走进了我们的日常生活.但是当我们搜索当下热门的智能家居品牌的时候,搜索结果却有点令我们吃惊. 在时下热门的智能家居品牌排行中,表中排行前列的智能家居品牌中小米.联想以及现在的新晋智能家居品牌:亚马逊,这三个品牌原本都不是做智能家居起家的,小米:手机,联想:电脑,亚马逊:电商平台.到底智能家居领域有着什么样的吸引力,会将这些本已在自己所在的领域成功扎根的品

揭秘阿里巴巴智能语音交互技术

当一个产品经理在规划产品中的语音功能时,在大多数情况下,他需要的不仅仅是语音识别,还需要其背后的智能交互--理解问题.回答问题.在需要的时候发问.能根据用户回答决策等. 阿里云智能语音交互,就是这样的一款产品.它基于语音和自然语言技术构建的在线服务,为开发者在产品中提供"能听.会说.懂你"式的智能人机交互体验. 阿里云智能语音交互背后实际上包含三个层次技术:语音技术.智能化技术和大数据技术. 语音技术: 语音识别(ASR)--把人讲的话转成文字 语音合成(TTS)--把文字说出来 声纹

智能语音交互:阿里的研究和实践

云栖TechDay40期,iDST智能语音交互团队总监智捷带来智能语音交互的演讲.本文主要讲解了语音识别的核心组件,语音识别准确率以及影响准确率因素,还分享了iDST智能语音交互以及阿里云的对外输出.   在众多的人工智能应用中,智能语音交互是大众能够最近距离接触到的一个.从几年前的手机语音助手,到近年来的互联网汽车.智能音箱.电视.IoT设备等,语音交互正以前所未有的深度和广度,融入雨后春笋般涌现的各种智能设备中.国内外各大互联网公司和众多初创企业都瞄准了智能语音交互这一重要领域,并视其为下一

盘点智能语音行业:Nuance没落 BAT围绕核心业务

随着人工智能浪潮的来临,以及物联网场景下应用需求的不断扩大,智能语音技术在智能家居.智能汽车.教育等领域的应用逐步深入,带动着智能语音产业规模的持续快速增长.再加上"互联网女皇"玛丽·米克尔在报告中大篇章的描述语音识别交互带来的改变,今天借着这股智能语音之风,让我们盘点一下现如今国内外智能语音行业的发展现状. 国外巨头盘点: Nuance没落.亚马逊Google布局智能家居 Nuance 提及语音识别,就不能不说Nuance, Nuance有着辉煌的历史,曾经在语音领域一统江湖.虽然一

阿里云智能语音交互技术实践干货分享

阿里云技术总监/研发总监陈一宁博士通过直播分享了<阿里云智能语音交互技术实践>.他首先介绍了智能语音面临的技术挑战,然后对智能语音技术做了详细介绍.其中,他主要分享了阿里云使用的BLSTM & LFR声学模型的优化过程,并对基于深度学习的自然语言理解的不同场景进行了详细分享.   以下内容根据直播视频整理而成.   阿里云智能语音概述 阿里云智能语音交互=语音+自然语言处理,语音包括语音识别.语音合成.声纹等,自然语言处理包括自然语言理解.对话系统.问答系统等.阿里云智能语音团队不是一

智能语音市场有多大? 阿里巴巴将如何破局后来者居上?

本文讲的是智能语音市场有多大? 阿里巴巴将如何破局后来者居上?[IT168 评论]"我在,你说" "天猫精灵,99*99等于多少?" "9801." "天猫精灵,请定一下明天早上七点半的闹钟." "好的,已为您帮设定XX日上午7点30分的闹钟." "天猫精灵,请帮我找到我的手机....." "正在拨打您的手机." "天猫精灵,马baba是谁?" &