阿里云智能语音交互服务导览

阿里云智能语音交互

产品介绍 & 接口文档

阿里云iDST的智能语音交互服务主要有以下几个大类:

  • 语音识别服务ASR :将语音转换成文字的能力快速集成,打造出“能听”的应用。
  • 语音合成服务TTS :将文字转换为声音的能力快速集成,打造出“会说”的应用。
  • 自然语音处理NLU :集语义解析、智能问答、意图识别等功能于一体,让应用具备理解能力。

语音识别服务ASR:

**在线 实时 短语音识别:一句话识别

  • 支持流式和非流式的语音识别模式
  • 应用模式: 语音输入法、语音搜索、语音助手等
  • 应用领域:YunOS、支付宝语音搜索、天猫魔盒、手机淘宝、聚划算等

在线 实时 长语音识别:实时长语音识别

  • 应用领域:直播实时转写、会议记录、语音笔记

在线 非实时 长语音文件识别:录音文件识别服务

  • 支持单轨/双轨的wav格式、MP3格式的语音文件识别
  • 目前只支持8k和16k的采样率;
  • 支持普通话识别
  • 应用领域:客服质检领域等

语音合成服务TTS:

在线 实时 语音合成: 语音合成

  • 实时播报
  • 应用领域:钉钉语音电话、菜鸟物流信息播报、新闻播报

在线 实时 语音合成 批量工具: TTS批量合成工具

  • 语音合成测试、批量处理
  • 应用领域:有声小说

智能对话平台

智能对话平台: 智能对话平台

  • 智能对话平台,能够让您在这上面快速搭建自己的对话机器人。
  • 应用领域:智能客服、教育、医疗等

自然语音处理NLU:

在线 语音识别+自然语音处理: 自然语音理解

  • 聊天对话:语音助手就像一个聊天机器人,能和用户直接对话
  • 获取信息:根据用户不同的需要,可以通过语音助手来了解信息,要知天下百事,就问语音助手。
  • 操控手机:能用语音控制手机的操作,打电话、发短信,直接说“打电话给XX”或者“发短信给XX” 非常简便
  • 通过语法、语义、语用的分析,获取自然语言的语义表示。
  • 领域列表:应用、餐厅、休闲娱乐、地图、火车票、飞机票、影院、美食团购、酒店、汽车限行、导航、实时路况、天气、公交站点、地铁站点、热映电影、股票、快递、违章、视频、音乐、优惠券、体育赛事、闹钟、提醒、电视频道
时间: 2024-08-03 17:58:41

阿里云智能语音交互服务导览的相关文章

阿里云智能语音交互iOS接入FAQ

阿里云智能语音交互iOS接入FAQ 问题1 : bitcode. ld: 'xxx/NlsClientSDK.framework/NlsClientSDK(NlsRecognizer.o)' does not contain bitcode. You must rebuild it with bitcode enabled (Xcode setting ENABLE_BITCODE), obtain an updated library from the vendor, or disable b

阿里云智能语音交互技术实践干货分享

阿里云技术总监/研发总监陈一宁博士通过直播分享了<阿里云智能语音交互技术实践>.他首先介绍了智能语音面临的技术挑战,然后对智能语音技术做了详细介绍.其中,他主要分享了阿里云使用的BLSTM & LFR声学模型的优化过程,并对基于深度学习的自然语言理解的不同场景进行了详细分享.   以下内容根据直播视频整理而成.   阿里云智能语音概述 阿里云智能语音交互=语音+自然语言处理,语音包括语音识别.语音合成.声纹等,自然语言处理包括自然语言理解.对话系统.问答系统等.阿里云智能语音团队不是一

阿里云智能对话分析服务的前世今生

阿里云智能对话分析,脱胎于对阿里云小二服务质量的检验,有点习武防身不小心成了武林高手的感觉.(开个玩笑,其实当然是精心规划的智能服务产品!)今天的云享团,请来的是智能对话分析的专家,进入阿里云后目前已申请5项专利的玄域:具有多年软件研发.测试.性能调优等IT相关从业经历,目前从事智能对话分析服务的研发,喜欢钻研与创新!关于这款产品的背景.流程.场景.实例,玄域为你一一分享! 背景 大量服务数据的产生        正如大家所知,随着阿里云业务的持续快速发展,业务量越来越大,服务的客户也越来越多,

从服务对话中挖掘价值 ——阿里云智能对话分析服务深度解析

智能对话分析服务的由来 就我们阿里云来说,每天都要处理大量的工单以及电话,我们处理完成这些工单和电话的服务质量如何?电话中对话内容是否合规?对于客户的问题,如网络不稳定,主机出问题等等,我们是否解决了问题?对工单和电话内容的服务质量检查和数据分析,成为了我们的一个较为复杂的需求. 解决这个问题的难点有二: 1.对话量大 假设有500个电话坐席,每个坐席每天可接5小时电话,那么每天就有2500小时的数据量产生. 2.数据分析困难. 对话内容包含大量口语.专业术语.相同意思的不同表述和上下文逻辑.以

智能语音交互:阿里的研究和实践

云栖TechDay40期,iDST智能语音交互团队总监智捷带来智能语音交互的演讲.本文主要讲解了语音识别的核心组件,语音识别准确率以及影响准确率因素,还分享了iDST智能语音交互以及阿里云的对外输出.   在众多的人工智能应用中,智能语音交互是大众能够最近距离接触到的一个.从几年前的手机语音助手,到近年来的互联网汽车.智能音箱.电视.IoT设备等,语音交互正以前所未有的深度和广度,融入雨后春笋般涌现的各种智能设备中.国内外各大互联网公司和众多初创企业都瞄准了智能语音交互这一重要领域,并视其为下一

专访阿里 iDST 语音组总监鄢志杰:智能语音交互从技术到产品,有哪些坑和细节要注意?

雷锋网按:在外界看来,阿里 iDST 是一个神秘的部门,大家知道里面聚集了很多技术大牛,但是对这个部门真正在做的事情,以及其在阿里集团内扮演的角色却不一定清楚.为此,雷锋网对阿里 iDST 的语音专家鄢志杰博士进行了专访,带大家了解有关阿里 iDST 的事情,以及他们是如何看待当下最火的一些 AI 产品的. 鄢志杰简介 鄢志杰,阿里巴巴 iDST (Institute of Data Science and Technologies) 智能语音交互团队总监.在 2015 年加入阿里巴巴前,就职于

阿里云智能图像识别服务发布

在2017云栖大会-上海峰会上阿里巴巴iDST研究员华先胜.阿里巴巴iDST高级算法专家三湘等共同发布了阿里云智能图像识别服务.由于大数据和深度学习算法的发展,图像识别技术发展迅猛.据估计在2020总市场规模将达到百亿美元,阿里云顺势推出了智能图像识别服务.根据客户痛点,阿里云给出了一站式解决方案.在智能图像识别算法方面,阿里云在效率和精度上已经达到了国际水平.并且,智能图像识别服务还可以在线申请.

AI与大众最近的接触——智能语音交互

互联网的变迁过程 互联网的变迁主要体现在内容.入口.人机界面三个方面. 互联网内容的变迁 图一 互联网内容的变迁 时至今日,互联网的内容已经发生了很多变迁,早期的互联网以获取信息为主,例如人们通过Email收发信息.在BBS上灌水.通过门户网站了解新闻等等.阿里巴巴的起点也是从Alibaba.com开始,最初仅是为国外买家获取信息.购买国内供应商的产品起到牵线搭桥的作用. 随着网络的发展,互联网不仅仅再局限于获取信息,消费者逐渐可以通过淘宝.天猫.聚划算等网站购买生活必须品:现在,除了提供信息和

智能语音交互平台决战在即,创业者们的机会在哪儿?

本文作者李智勇,十年栈道程序员,有一个好玩的公号:zuomoshi(琢磨事). 平台是很有意思的一种软件品类,先天具有过去很多产品所不具备的一些特质,比如彼此间的不相容性(也可以叫寡头性).非线性增长性等.这些特性也就注定了现在语音交互赛道上的各种平台早晚之间必有一战. 注意力过剩的语音交互赛道 很多人可能并没注意到纯以平台论,语音交互这个赛道已经足够拥挤.最先发的有百度 DuerOS,随后陆续跟进的有阿里的 Aligene 和腾讯的小微,最近发布的则有思必驰的 DUI 和京东的 Alpha,小