中国人工智能学会通讯——智能语音技术与产业应用展望 1.2 智能语音产业应用的现状和挑战

1.2 智能语音产业应用的现状和挑战

智能语音产业应用,基本上都是从语音控制、语音识别和语音交互作为切入点建立起来的,根据不同的定位和形态,目前主要分为以下4类。

(1)APP类纯软语音应用。如Apple Siri和Microsoft Cortana等,在手机、平板或PC上以软件方式解决操作和聊天等问题,内置各种搜索、问答和对话服务。

(2)软硬一体的语音交互应用。如智能音箱Amazon Echo、智能电视、智能语音空调等应用,语音成为主要交互手段,实现控制和相关内容服务获取。

(3)垂直领域的语音转写应用。如医疗语音病例录入、法律语音转写、语音客服数据分析等,将语音数据进行实时或离线转录,后期做结构化分析。

(4)基于语音识别的口语评测等应用。对用户口语语音进行发音、流利度、韵律等评估,并检测口语发音、语法等错误,帮助用户提升口语水平。

智能语音产业应用,目前还面临着用户普及率、认可度和活跃度不够高的问题,原因是多样的,这些挑战主要包括下面4个方面。

(1)基础技术需要继续改进和完善。特别是复杂应用场景、噪声、口音和专业领域的语音识别稳定性和适应性,是扩大实用范围的关键,更多的是针对具体应用问题进行优化,提高准确度;与此同时,还要提高语义理解和容错能力,减少用户人机交互过程出错的影响。

(2)统一的智能语音交互设计标准和规范。语音是新兴人机交互方式,与传统的触屏交互相比,优势在于表达丰富和快速一键直达的能力;劣势在于不像GUI所见即所得那么直观,还有一定出错率,会给用户造成一定的交互心理障碍。

(3)高集成度的智能语音交互方案。除了手机、平板之外,智能设备普遍没有录音功能,降噪更难解决,开发者对语音相关引擎的优势、局限理解不清晰,加上用户对语音交互的认知还缺乏统一规范,高集成度的智能语音交互方案,对快速落地就特别重要。

(4)标准和开放的内容和服务接口。智能语音交互方案,解决的是用户以更加快捷和自然的方式获取内容服务的问题,但内容和服务本身,需要针对智能语音交互方式进行优化,是一个重要的问题。

时间: 2024-11-17 12:01:36

中国人工智能学会通讯——智能语音技术与产业应用展望 1.2 智能语音产业应用的现状和挑战的相关文章

中国人工智能学会通讯——机器人组件技术在智能制造系统中的应用

摘要:随着工业4.0时代的到来,如何将传统工厂改造成为个性化.网络化.柔性生产的智能制造系统成为了当前的研究热点.本文从智能制造系统和智能机器人系统的相似性出发,构建了基于机器人组件技术的智能制造系统,对智能制造系统中各个生产单元进行组件化技术封装,实现了生产组件之间的信息互联和即插即用,通过个性化订单要求对各生产组件在线任务规划,达到柔性生产的目标.此外用多异构机器人模拟各工位生产单位搭建了一个可以根据用户订单生产的小型智能制造实验平台,实验结果验证了本研究构建系统的可行性. 关键词:机器人组

中国人工智能学会通讯——智能机器人检测技术与平台

我觉得能够在这里跟大家分享我们的技术和成果,我个人感觉到非常光荣.今天跟大家分享的题目是<智能机器人检测技术与平台>.我今天跟大家汇报三个内容,讲一下技术和成果所呈现的平台建设的意义和它的实施情况,以及现在取得的一些成果. 关于意义,我简单说一句.因为这个论坛叫测评分论坛,所以说一下测评的对象是什么,是机器人.机器人实际上前面各位专家都分享了非常精彩的演讲,大家也都认知到了机器人其实是一个融合技术的产品.它实际上突破了我们传统的机器和电子,已经进入到了自动化技术.计算机技术,人工智能也是它很有

中国人工智能学会通讯——文字识别技术现状、挑战及机遇

今天非常高兴在这里作一个文字识别的技术现状.目前存在的问题及挑战.学术研究和商业应用机遇,以及未来技术发展趋势的报告. 首先简要谈一下人工智能.去年3月份,美国纽约时报采访了硅谷一些IT的大神们,请他们谈一下未来IT领域当中什么方向是潜在的爆发点,当时很多专家都不约而同谈到一个观点,就是人工智能很可能是未来IT领域的大事件.其实不仅仅是在工业界,在计算机学术界乃至整个科学界,人工智能过去几年都是非常热门的研究话题,举例来说,在过去两年,与深度学习和机器学习相关的文章已经有5次上了Nature或S

《中国人工智能学会通讯》——9.21 基于任务规划的资源卫星智能管控模式

9.21 基于任务规划的资源卫星智能管控模式 我国目前已建成包括高分.遥感.环境减灾.测绘和试验等多系列资源卫星系统,在轨运行的卫星 20 多颗.随着成像卫星的发展,成像卫星任务规划问题也逐渐引起重视.目前,国内外已经开展了很多成像卫星任务规划问题的研究.下面主要从单星任务规划和多星任务规划两个方面对资源卫星任务规划问题的国内外研究现状进行综述. 单星任务规划 (1) 面向点目标的单星任务规划.Bensanaet al [1-2] 将 SPOT 5 卫星日常任务规划问题抽象为整数规划模型.Wol

中国人工智能学会通讯——互联网搜索技术的前沿探索 3 信息匹配与排序

3 信息匹配与排序 针对用户需求和网络数据的匹配,排序学习技术通过机器学习的方法进行结果排序,是当前搜索引擎主流的解决方案.然而,传统的排序学习技术依赖于对全集样本的多级标注和学习,标注可信度低且不能很好地体现检索中关注位置的特点:同时传统的排序学习技术建立在文档独立性假设之上,难以建模多样性等问题.我们提出了Top-k排序学习[9-10]和关系排序学习框架[11-12],突破了传统的基于分级标注体系,以及文档样本独立性假设,能更好地适用于互联网搜索. 3.1 Top-k排序学习框架 传统排序学

《中国人工智能学会通讯》——12.8 序列模式挖掘趋势展望

12.8 序列模式挖掘趋势展望 近年来,数据挖掘会议和期刊中将模式与统计结合成为较热门的研究方向[47-49] ,通过统计方法对数据模式进行剪枝.判断模式的"有趣性"成为热点.例如,Nakagawa 等人[50]提出基于统计的安全剪枝规则对数据模式进行剪枝:Tatti [47] 提出的基于概率的划分模型 , 可以根据所预测的"有趣性"对无间隔的频繁情景模式进行排序.此外,在数据库会议和期刊中,面向大规模数据的具有高可扩展能力的序列模式挖掘算法也不断发表[33,51]

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——混合智能概念与新进展

脑科学以阐明脑的工作原理为目标,近年来已成为最重要的科学前沿领域之一.脑功能计算.脑智能模仿再度成为学术界和产业界热议话题[1-4].欧盟.美国.日本相继启动了大型脑研究计划,强有力推动了人们对脑结构.脑功能和脑智能的探索和认识:另一方面,人工智能研究风起云涌,最近一个标志性事件是谷歌的AlphaGo以4:1战胜围棋世界冠军李世石[5],实现了围棋人工智能领域史无前例的突破.2016年9月斯坦福大学发布了<2030年的人工智能与生活>报告[6],全面评估了当前人工智能的进展.挑战.机遇与展望.

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人