解析手机语音交互设计

  语音识别技术,也被称为自动语音识别,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。

  语音识别技术作为输入方式,比按键输入和手势输入更为快捷,学习成本很低,对于非特定人连续语音识别系统的识别率达到98.73%,已经达到实用要求,具有广阔的应用前景,在手机端的应用有语音拨号、语音输入、语音命令、语音搜索和语音翻译等。

  语音的技术原理比较复杂,可以从语音交互的过程来理解:


  1.开启语音识别功能。一般由用户手动点击按钮启动,手机端暂时无法自动启动,如由语音命令启动或者根据音量高低判断开始识别。


  2.进入说话界面。程序界面会通过视觉体现音量的变化。

  3.说话完毕,系统开始分析。结束输入有两种方式:一是自动关闭,通常时输入单词完毕之后自己的关闭,另一种是用户手机手动关闭。系统处理过程可以分为以下几个步骤:


  a)前端处理。该模块的主要任务是从输入信号中去除噪音等影响结果的因素,提取特征,供声学模型处理。信号处理之前会先进行断点检测,端点检测是指在语音信号中将语音和非语音信号时段区分开来,准确地确定出语音信号的起始点。经过端点检测后,后续处理就可以只对语音信号进行,这对提高模型的精确度和识别正确率有重要作用。语音增强的主要任务就是消除环境噪声对语音的影响。目前通用的方法是采用维纳滤波,该方法在噪声较大的情况下效果好于其它滤波器。

  b)声学特征提取。声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,目的是使模式划分器能更好地划分。如上传音频会利用到语音编码解码技术,可以减少音频的文件大小、存储空间或者传输比特率。

  c)统计声学模型。计算各个帧的声学特征,如上下文建模。根据发声机理,音之间只能渐变,前一音会影响后一音,从而使得后一个音的频谱与其他条件下的频谱产生差异,从而使模型能更准确地描述语音。

  d)发音词典。发音词典包含系统所能处理的词汇集及其发音,类似于拼音输入法的词库。如输入法,词典更新热词和词库有组于提高匹配的准确率。

  e)语言模型。语言模型对系统所针对的语言进行建模,如分析语音上下文。

  由于音频文件大小的限制,本地只能存储少量的词典,这也就要求复杂的语音需要连接服务器分析。谷歌语音搜索在用户输入完成之后才提示无法联网,在启动输入之前就应该检查网络连接状况。


  4.系统分析完毕输出结果。一种是根据结果自动显示结果,如bing搜索,另外一种是提供选项供用户选择,这和输出结果的概率高低有一定关系。用户选择的结果对于词典的排序产生影响,增强语音的自适应和强健性,帮助形成个性化输入。

  根据产品可识别的词汇量区分产品,对于特定语音命令,用户只能输入符合命令的词汇,比如说出联系人名字搜索。输入法的词汇更多,而语句搜索不但需要庞大的词汇库,处理连续的语音输入需要区分连音和变音,还要求能根据上下文和热词输出更为合理的结果。条件限制越少,语音识别的难度越大。因为一定程度上避免模糊音,词典数据越少,输入特定词汇的准确率越高。

  中文的语音输入与英文不同,英文匹配不到词典配置的词就无法识别,中文词汇由单字组成,中文可以根据单字识别。

  io 5的输入法已经加入语音功能,会逐步变为手机输入的常规功能,最终输出结果的准确率和操作流畅度是衡量其交互优劣的重要标准。

  作者:晓生

  文章来源:daichuanqing.com/index.php/archives/2800

时间: 2024-11-03 08:37:34

解析手机语音交互设计的相关文章

浅析手机语音交互设计

语音识别技术,也被称为自动语音识别,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键.二进制编码或者字符序列. 语音识别技术作为输入方式,比按键输入和手势输入更为快捷,http://www.aliyun.com/zixun/aggregation/10547.html">学习成本很低,对于非特定人连续语音识别系统的识别率达到98.73%,已经达到实用要求,具有广阔的应用前景,在手机端的应用有语音拨号.语音输入.语音命令.语音搜索和语音翻译等. 语音的技术原理比较复杂,可以从

手机的交互设计方法:手机产品交互设计原则

一.用户体验信息收集 在讨论手机的交互设计方法之前,需要先对手机的用户使用习惯有一些基本的了解,需要对手机的用户体验信息做一些收集整理.收集用户体验信息首先需要确定两个问题:一是确定目标用户群体:二是确定信息收集的方法和途径. 在确定目标用户群体的时候,很显然的是,已有产品有过使用和交互经验,具备该产品或系统的交互体验的用户,相比较于那些没有体验的用户,可以为设计提供更多更有效的信息.因此在收集用户体验信息时,应该首先考虑所需设计的产品的用户或是有过类似产品使用经验的用户.在理想的情况下,当用

手机网站交互设计中的信息设计

在手机上浏览信息,存在着太多的局限,手机屏幕小注定了一页不能显示太多的信息,环境光线的变化注定页面设计不能过于花哨,流量限制注定不能有太多的图片和样式. 如果让你的用户直接在手机上浏览为web所设计的网页,即使是经过一些手机浏览器的优化,体验还是会很糟糕,甚至有时候会让人难以忍受. 如何调整信息展现方式,使内容能在小屏幕的手机上也更友好的展现呢?接下来我将通过一些原理和实例来阐述自己的观点. 首先,老祖宗Ben Shneiderman的交互设计8项黄金法则我们要铭记于心,因为这些法则也是适用于移

手机客户端交互设计原则及信息展现方式

在手机上浏览信息,存在着太多的局限,手机屏幕小注定了一页不能显示太多的信息,环境光线的变化注定页面设计不能过于花哨,流量限制注定不能有太多的图片和样式. 如果让你的用户直接在手机上浏览为web所设计的网页,即使是经过一些手机浏览器的优化,体验还是会很糟糕,甚至有时候会让人难以忍受. 如何调整信息展现方式,使内容能在小屏幕的手机上也更友好的展现呢?接下来我将通过一些原理和实例来阐述自己的观点. 首先,老祖宗Ben Shneiderman的交互设计8项黄金法则我们要铭记于心,因为这些法则也是适用于移

手机界面交互设计:合理的导航方式设计

文章描述:手机界面常用导航设计分析. 所谓的交互设计,其实设计的就是人如何向机器发送指令,机器如何向人传达信息,一来一往是为交互.当要传达的信息量很少时,好办,就像Google的搜索框那样,往白底上一放就行了.但当等到信息是海量的.在一屏上难以全部呈现时,就需要有效地组织信息,将部分信息先隐藏起来,待到用户需要时再将用户引导到那里.在界面设计中,广义地来讲,从一组信息向另一组信息转移的的过程,就称之为导航. 明确了定义,我们就该知道,一个好的导航设计应该让用户明白: 1.现在在哪儿 2.以前去过

解析手机交互式UI设计指南

Web开发社区有着大量的交互式设计轻松解决方案.虽然现在大多数网站都能够做到交互性了,但是我们需要不断向前.创新.我们很容易将注意力集中到编码方面,但是有时候不同屏幕尺寸的实际设计考虑却往往被忽视. 很多交互式设计学习资料都谈到了基础的方面,比如利用桌面的多余空间,使手机上的显示更简单.然而,很多东西没有超出这些基础知识.随着各种尺寸屏幕的出现,我们需要进一步思考设计和用户体验这些方面. 1. 桌面 大多数用户体验原则都是有关桌面网站的.市面上用户多使用键盘,触摸板,鼠标,这使我们有更多的设计可

手机界面交互设计:app的分类信息的布局方式

文章描述:APP上的分类信息的布局方式. 本文总结了一些app的分类信息的布局方式.以后发现其他样式了会继续更新,欢迎补充. 1,九宫格,如大众点评.人人网.facebook等. 2,每个分类平铺成条,如淘宝,凡客,京东.QQ美食,非常清晰. 3,下拉选择框,如维络城.QQ美食.百度身边,主要在于对信息进行筛选时使用. 4,大图滑动,如凡客.时光网等. 5,图片平铺,如百度身边.淘宝. 6,分类以标签的形式在上方导航条的下面水平铺开,可以滑动.比如网易新闻客户端.每讯客户端.QQandroid版

移动的交互设计:手机语音自动识别的交互设计

文章描述:浅析手机语音交互设计. 语音识别技术,也被称为自动语音识别,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键.二进制编码或者字符序列. 语音识别技术作为输入方式,比按键输入和手势输入更为快捷,学习成本很低,对于非特定人连续语音识别系统的识别率达到98.73%,已经达到实用要求,具有广阔的应用前景,在手机端的应用有语音拨号.语音输入.语音命令.语音搜索和语音翻译等. 语音的技术原理比较复杂,可以从语音交互的过程来理解: 1.开启语音识别功能.一般由用户手动点击按钮启动,手

基于用户体验的手机产品交互设计原则

一.用户体验信息收集 在讨论手机的交互设计方法之前,需要先对手机的用户使用习惯有一些基本的了解,需要对手机的用户体验信息做一些收集整理.收集用户体验信息首先需要确定两个问题:一是确定目标用户群体:二是确定信息收集的方法和途径. 在确定目标用户群体的时候,很显然的是,已有产品有过使用和交互经验,具备该产品或系统的交互体验的用户,相比较于那些没有体验的用户,可以为设计提供更多更有效的信息.因此在收集用户体验信息时,应该首先考虑所需设计的产品的用户或是有过类似产品使用经验的用户.在理想的情况下,当用