Siri的语音交互革命


  iPhone 4S融入了语音功能,这将是手机的革命性的交互操作。或许你使用过Android的语音命令、Bing的语言搜索和Dragon Dictation的语音输入,但是这些和Siri还有很大差距:

  a.语音命令只能理解系统特定的词汇。

  b.语音搜索与手动输入是并列搜索方式,识别词汇再搜索。

  c.语音输入也是将语音声波转换为文本。

  而Siri不但包含以上技术,看似还要理解用户说话的意思,将人类语言翻译成系统可以理解的语言,之后再执行命令。之所以像是理解用户,个人认为原因在于:

  a.视频弱化了特定的语音命令,比之前的语音操作看起来更像是人与人之间的沟通,启动操作符合用户语言习惯。

  b.有人性化的语音反馈,而不是呆板的视觉反馈,手机就是一位声音甜美的私人助理。

  c.覆盖了手机常用功能,不限于某个特定的应用程序中使用。

  d.做的更为彻底,很少有手动点击行为,这会影响语音交互的流畅度。

  从资料和视频中看看Siri可以做哪些事情及其存在的问题:

  1.结合蓝牙4.0或者耳机唤醒手机。语音搜索和语音输入等技术都要用户手动点击按钮触发语音功能,这事本身就不够酷。但是不借助设备还存在困难,语音功能实时开启探测声波会耗费电量。


  2.语音功能面临噪音和识别来源的问题,在视频中Siri都是在个人独处,比较安静的环境下使用,适用的场景比较单一。或许以后会加上定向麦克风和声纹判定声波来源,排除外界干扰。


  3.包含语音搜索,可以直接搜索天气、股票、联系人和地址,这类搜索结果单一,不需要从众多结果中选择。

  4.包含语音命令,语音查询联系人、启动某个应用程序和设置闹钟等,但还限于手机中常用的功能。命令必须是特定的语句格式,比如打电话是“call+ 人名”,播放音乐是“play+歌名”,短信是“tell+人名+内容”。


  5.语音播报短信文本,语音输入短信和邮件,但系统可能会进行二次确认,将输入内容再次读一遍,适合盲人使用。这种语音输入和语聊一样,需要用户点击按钮触发系统开始探测声波。

  6.系统在答复用户时,使用人性化语句交流,而不是简单的完成命令或者特定的词组。

  设想下所有的手机操作都可以使用语音完成,大大减少文本输入和功能之间的频繁切换,更多的应用程序会支持语音交互。随着产品迭代,语音真有可能把手机变为智能机器人,不仅仅是执行命令,陪用户聊天等更为复杂的机器翻译也可能融入到手机中,Siri才只是个开始。

  文章来源:晓生语录 转载请注明出处链接。

时间: 2024-12-22 15:49:54

Siri的语音交互革命的相关文章

没有语音交互,不谈智能手表

    智能手表的自我修养:自由.安全感.活在当下 一块合格的智能手表,除了可以耍帅看时间外,还应该能够让用户获得生理和心理上的自由:即使双手不接触设备,也能方便地启动设备和发布指令:即使视线并不锁定在屏幕上,也能用眼角的余光快速获得最重要的信息. 同时,智能手表还应能及时推送最相关的资讯,过滤垃圾信息和噪音,给予用户随时在线的安全感,以便用户专注于最重要的事情. 简而言之,智能手表不应该是戴在手腕上的缩小版智能手机.另一个信息干扰源,而应帮助用户更好地活在当下,享受生命的真实和美好. 语音交互

AI与大众最近的接触——智能语音交互

互联网的变迁过程 互联网的变迁主要体现在内容.入口.人机界面三个方面. 互联网内容的变迁 图一 互联网内容的变迁 时至今日,互联网的内容已经发生了很多变迁,早期的互联网以获取信息为主,例如人们通过Email收发信息.在BBS上灌水.通过门户网站了解新闻等等.阿里巴巴的起点也是从Alibaba.com开始,最初仅是为国外买家获取信息.购买国内供应商的产品起到牵线搭桥的作用. 随着网络的发展,互联网不仅仅再局限于获取信息,消费者逐渐可以通过淘宝.天猫.聚划算等网站购买生活必须品:现在,除了提供信息和

Alexa估值近百亿美元,AI巨头为何在语音交互市场抢夺赛道?

1.国内外巨头相继进入语音交互领域 去年10月份,Intel与科大讯飞宣布合作共同研发AI芯片,该芯片将麦克风阵列.远场语音识别等功能集成到SOC当中,形成完整的远场语音交互链条,此次合作正式宣告Intel也将进入智能语音交互市场. 此前,科大讯飞的麦克风阵列等硬件一直委托国内的全志科技研发,全志科技显然是ARM阵营的追随者.然而,根据Intel内部人员的透露,科大讯飞对于和国内芯片厂商的合作并不完全满意,语音交互市场竞争激烈,而国内初创公司如声智科技等,在麦克风阵列技术和方案方面带给讯飞不小的

Airpods 并非无用,而是苹果借助语音交互布局物联网的新“棋子”

新一代 iPhone 最大的槽点或许就是取消35毫米的耳机接口,随着而来的,则是对苹果此次力推的无线耳机 AirPods 的「口诛笔伐」.但千万不要把 AirPods 仅仅作为一款耳机,一款属于 iPhone 的配件.事实上,苹果为 AirPods 找到了新定位,此处的竞争对手并非各种蓝牙无线耳机厂商,而是亚马逊和 Google. AirPods 的市场定位 如果仔细看过今年 6 月份互联网女皇 Meeker 的报告,相信对下面这幅图并不陌生: 上面这幅图就是人机交互的演变.进入电脑时代,人机交

Alexa已经疯狂扩张到10000项技能,但断言它是语音交互的未来还太早

雷锋网消息:亚马逊周四宣布,旗下的Alexa智能语音助手平台已经拥有超过10000项"技能"(Skill).去年1月,这个数字还只有130,到11月也才刚刚突破5000,因此这个增速相当惊人. Alexa是预装在亚马逊Echo智能音箱内的虚拟助手,它可以接受各种语音命令,相当于亚马逊版的Siri.在使用Echo的时候,只需要说一声"Alexa"就可以启动它. 2015年6月,亚马逊宣布开放Alexa平台,第三方开发者可以在该平台上开发基于语音的技能.随着第三方的开发

语音交互将改变车联网体验

文/国仁通信展上也有不少车联网的内容,中国移动展示了加载4G网络的改装版高尔夫6:中兴展台则摆出了一辆Smart,原来是要展示一款叫驾驶助手的手机应用.与旁边的技术人员详聊后,发现这个驾驶助手还是有其特色的,也难怪中兴在大屏幕上轮播这个应用的视频广告.与我交流的是Nuance公司的技术人员,对,就是给苹果公司提供Siri语音技术支持的公司,这家国际上的语音技术巨头现在也开始广泛和国内厂商合作了.我好奇的一点是,这个驾驶助手的软件和其他导航软件,iOS和Android的驾车模式有何不同?语音交互将

语音控制解决方案服务商Wit:几行代码为第三方App搞定语音交互界面

摘要: 语音,即便不是下一代计算设备群(即物联网)的唯一交互方式,也是最自然的方式,在开车.做饭以及各种束手的状态下,语音识别及自然语言解析的好处不难体会. 语音交互解决方 语音,即便不是下一代计算设备群(即物联网)的唯一交互方式,也是最自然的方式,在开车.做饭以及各种"束手"的状态下,语音识别及自然语言解析的好处不难体会. 语音交互解决方案服务商Wit要做的就是,简单在第三方App中加入几行代码来为它生成一个语音交互界面,正如移动支付公司Stripe通过几行代码就为网站解决了线上支付

盘点麦克风技术及市场,远场语音交互如何选型麦克风?

智能语音交互市场的火热逐渐辐射到产业链的供应商,其中最直接受益就是作为声音的传感设备--麦克风.特别是麦克风阵列的兴起,未来可以让麦克风厂家的销量翻倍增长.在此之前,由于受制于智能手机和平板电脑的增长速度下滑,楼氏.歌尔和瑞声等麦克风厂商的股票相继在2016年中旬左右创下了低谷. 2017年的语音交互局势趋于明朗,资本市场专注研究智能语音交互的投资机构也明显多了起来.那么,这就有必要深入了解一下麦克风这个行业以及技术的趋势. 什么是麦克风?有哪些种类和指标参考? 麦克风作为业界通俗的一种叫法,是

预告:语音交互前沿技术分享——INTERSPEECH 2017系列

今年的INTERSPEECH于8月20日至24日在瑞典的斯德哥尔摩顺利召开,共历时5天.据了解,本次大会共有839篇论文被大会接受,分成109个session.众多的高校研究机构和著名的公司纷纷在本次会议上介绍了各自最新的技术.系统和相关产品,而阿里巴巴集团作为钻石赞助商也派出了强大的阵容前往现场. 首期分享将在10月25日(本周三)晚上7点半正式开始,欢迎关注语音识别技术的同学报名参与(报名请戳这里)!. 直播主题:语音识别技术之自适应技术 内容简介:语音识别技术是将语音转换成文字的技术,而说