Alexa:聊天机器人前路漫漫,大坑不少

亚马逊 Echo 音箱发售以来,消费者仿佛着了魔,去年一年,数百万美国用户家中迎来了新的美国“好声音”Alexa。与此同时,支持语音控制的设备成了市场的新宠,今年的 CES 上大量公司都将触角伸向了该领域。

回顾今年的
CES,支持语音控制的产品确实迎来了市场拐点。先是通用电气推出了兼容 Alexa 的电灯,随后 Dish(美国卫星电视巨头)又将 Alexa
塞入了你最爱的电视剧集中,就连三星的吸尘器都能听懂你的话了。业界大多数公司都蹭了一把热点,它们都看到了自然沟通方式位数字体验带来的巨大价值。

此外,雷锋网(公众号:雷锋网)注意到,今年语音控制设备的大爆发已经不是某一特定领域竞品为了争夺市场的对抗了,公司无论大小和形态,都想要挤进来分一杯羹。不过,厂商对于音频数字体验的开发才刚刚开始。

重温 iPhone 崛起的剧情

Alexa 是个极其智能的平台,不过要想真正“统治”世界,它还需要更大力度的创新。去年,亚马逊将该平台开放给了第三方开发者,这些外部帮手们能为兼容 Alexa 的设备补充更多弹药,提升其使用体验。

这样的手法与苹果如出一辙,初代 iPhone 确实产品力十足,但直到 App Store 正式上线,它的战斗力才真正得以释放。通过与第三方开发者共同努力,苹果建立了自己的生态系统,为用户提供独一无二的新体验。

这样的成功之路也是 Alexa 的必由之路,毕竟要论嘴皮子上的功夫,“Alexa,请关灯”这种单一的指令实在是太无趣了。

随着 Alexa 用户基础的不断增长,会有越来越多的厂商“臣服”于亚马逊,Echo 音箱背后的数百万用户可是一块巨大的蛋糕。不过,一切并没有想象中那么一帆风顺。

前路漫漫,大坑不少

过去几年,自然语言处理能力、位置信息服务和大数据分析技术获得了长足的发展,不过要想给
Alexa
这样的平台打造一款好用的语音应用依然困难重重。因为此类应用可不是简单的将语音控制能力叠加到现有的应用中,开发者必须充分发挥语音的特点,创造内容丰富、参与性强的使用体验。而设计、搭建、测试、控制,每一步都不能出乱子,只有这样才能创造革命性的体验。

此外,如何教这些语音应用分清上下文和信息编排也非常关键。毕竟,用语音操作特定的银行应用来享受金融服务是一件事,在一款大一统的银行应用中如何让语音助手弄清你到底要操作哪个账户是另一件事。我们需要设立通用的编排标准,保证
Alexa 平台上的应用能及时互相交换信息并从“货物”满满的仓库中找出订单上的“商品”。

不过,纸上谈兵容易,想实现理想中的效果可没那么简单,信息编排可是软件开发人员心中永远的痛,因为他们很难验证应用之间的协同合作是否正常,一旦网络资源被多个应用争抢,很容易造成系统崩溃。而以上这种情况还没有语音的加入,一旦添加了新的层级,其复杂性就会直线上升,因为开发者必须解决资源的争抢或挑战性十足的网络环境,同时让各个应用根据上下文相互沟通以决定到底谁来回答。

此外,开发者还要有超强的大局观,跳出自己的特定应用,确保在多种用户环境下应用能清晰理解上下文,因此仅对单一应用进行测试已经不够了,硬件制造商也必须为生态的搭建尽一份力。随着平台上应用数量的增加,Alexa

需要学会如何处理动态语境。硬件制造商则需要找到新算法来分析应用和服务的使用频率或推出多个资源中数据与答案整合的功能。只有硬件制造商与开发者联手,才能理顺这一复杂情况。

随着 Alexa 阵营加盟厂商的不断增多,市场必然会迎来新的增长点,要想将这一热潮延续,厂商和开发者必须携起手来解决发展路上的一些基础性的技术难题,这样才能实现视频与语音内容的整合,创造智能的新体验。

本文作者:大壮旅

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-30 15:39:30

Alexa:聊天机器人前路漫漫,大坑不少的相关文章

开放Alexa语音控制技术 亚马逊欲打造最有影响力的聊天机器人开发平台

对于聊天机器人开发者,这个月的大事件莫过于 Amazon Lex 平台的推出. 原因很简单:Lex 脱胎于"Alexa",是亚马逊智能语音助手 Alexa 的底层自动语音识别(ASR)与自然语言理解(NLU)技术. 另外,对于 Amazon Lex,亚马逊极有可能以打造出最受欢迎.使用人数最多的聊天机器人开发平台为目标.如果该目标实现,亚马逊无疑将把全世界的聊天机器人开发者聚集到其社区. Amazon Lex 是什么 Amazon Lex 最初发布于去年 11 月的 AWS re:In

学习笔记TF059:自然语言处理、智能聊天机器人

自然语言处理,语音处理.文本处理.语音识别(speech recognition),让计算机能够"听懂"人类语音,语音的文字信息"提取". 日本富国生命保险公司花170万美元安装人工智能系统,客户语言转换文本,分析词正面或负面.智能客服是人工能智能公司研究重点.循环神经网络(recurrent neural network,RNN)模型. 模型选择.每一个矩形是一个向量,箭头表示函数.最下面一行输入向量,最上面一行输出向量,中间一行RNN状态.一对一,没用RNN,如

清华大学黄民烈博士:如何让聊天机器人理解人类情感?

以微软小冰为代表的聊天机器人已经渗透到我们的日常生活中,虽然小冰会卖萌懂幽默,但距离真正的共情.理解人类的情绪还是有一定的距离.清华大学计算机系朱小燕.黄民烈老师团队今年的一项研究工作希望让聊天机器人具备这样的能力. 在这个名为 ECM(Emotional Chatting Machine:情绪化聊天机器人).基于深度学习的情感对话模型中,团队首次将情感因素引入了基于深度学习的生成模型中. 相关论文可查看<Emotional Chatting Machine: Emotional Convers

深度:解密巨头们所关注的聊天机器人

雷锋网(公众号:雷锋网)按:本文作者张俊,文章将会详细解密1)聊天机器人所要解决的三个问题:2)以及它们所使用的模式. 引言: chatbot是最近一段时间非常火的一个词或者一个应用,不仅仅各大新闻媒体在热炒bot的概念,各大巨头也投入巨大的资源进行研发,arxiv上刷出bot相关的paper也更是家常便饭.炒作归炒作,PR归PR,不得不说一个尴尬的事实是市面上确实难以找到一个真正好用的bot.bot按照涉及的领域,分为开放域(open-domain)和面向具体任务(task-oriented)

让AI聊天机器人成为谈判专家 Facebook前进了一大步

北京时间6月15日消息,Facebook研究人员表示,在训练聊天机器人谈判方面他们已经取得进步. Facebook AI Research(简称FAIR)团队最近发表论文,介绍了机器人如何在会话中提前制定计划,使用谈判策略. 开发出可以推理.可以交谈.可以谈判的聊天机器人,这就是Facebook的总目标,如此一来Facebook个人助手就可以与对手竞争,比如谷歌助手.亚马逊Alexa.苹果Siri和微软Cortana,还有更多的其它助手. 在博客文章中,Facebook说聊天机器人可以进行简短会

入侵保险业,聊天机器人有招?

以下为正文内容: 保险业正在积极寻求AI领域相关技术赋能,这与保险行业数据数据密集型行业,且信息交互频率高有一定关系.其中自2016年起,引入聊天机器人界面,国内国外保险业新老玩家都有不少涉足.保险业应用聊天机器人大家想到的往往仅是智能客服,事实上现今已不仅如此,且今天的智能客服也与昨日有别.这背后是风口推动还是刚需驱动,都有哪些不同玩法? 客户沟通成为重要关注点 我们知道,保险业因其产品服务属性,长期与客户之前存在严重知识鸿沟,营销售前效果与售后满意度,其中也包括理赔过程中的沟通体验不佳,导致

聊天机器人实力还是不行 咋能提升它们的知识水平

5月10日消息,据VentureBeat报道,自从电脑问世以来,科幻小说家们始终有这样的梦想:免提界面可对我们的任何问题作出回应,无需按下任何单键.现在,这样的未来正越来越接近现实,数十个行业的工程师们正努力设计能通过简单对话与人类互动的电脑和移动设备.这种技术被称为自然语言界面(NLI),苹果Siri.亚马逊Alexa.微软Cortana以及三星Bixby等就是典型代表,它们在接下来几个月将被应用到更多应用和程序中去. 然而众所周知,这些聊天机器人和自然语言界面也都存在"成长的烦恼"

聊天机器人5步重塑酒店业

至顶网软件频道消息:"聊天机器人"这个过去的时髦词现在的发展已经呈现出了上升趋势,聊天机器人也正在让自己值得更多的行业领域采用他. 意识到了聊天机器人潜力和可能性,很多行业已经开始利用这种技术.聊天机器人将通信自动化,提高客户体验并帮助分析客户偏好. Gartner认为,随着AI(人工智能)和聊天机器人日益受到关注,到2020年底,我们和聊天机器人的对话可能会比我们和自己配偶的对话还要多. 数字景观,特别是服务台将随着工作中的聊天机器人而彻底改变--只要实现就可以了. 会话界面的使用可

“小会话,大学问” - 如何让聊天机器人读懂对话历史?| 论文访谈间 #03

人工智能现在的火热程度大家有目共睹,凯文凯利在<必然>中预测未来时代的人工智能可能会重新定义人类的意义,但时下的人工智能发展水平显然还没有大家想象得那么美好,仍然需要我们不断地探索.目前众多研究人员正深耕其中,作为其中代表的聊天机器人(Chatbot),已然成为科研界研究的热点. 通常来说聊天机器人实现方式有两种:一种是基于生成式,即机器人"自己说话",一个字一个字创作出回复语句来.另外一种是基于检索式,即机器人"转发"别人的话.从互联网大家的话语中寻找