导读:微软认为,经过近二十年在机器学习和自然语言处理方面的进展,微软已经拥有最好的“大脑”,可以帮助微软缔造一个由人工智能驱动的美好未来。微软在打造与用户进行情感共鸣的智能设备方面已经先人一步,并率先在中国市场进行了测试。在几大科技巨头中,微软是第一家针对文本聊天界面而发布真正平台的公司——这是值得在智能手机兴起过程中一直靠边站、没啥参与度的微软引以为豪的一点。
◆ ◆ ◆
微软总裁萨蒂亚·纳德拉(Satya Nadella)一踏进会议室,就开始迫不及待地谈论智能问题。当时我在微软总部,听纳德拉激昂地谈论微软公司在打造更多智能应用和服务等方面的进展情况。纳德拉告诉我,每天早上,他都会戴上HoloLens全息眼镜,这款眼镜能够让他看到投影到自家墙壁上的虚拟现实、互动日历等内容。纳德拉在描述这些情况时,显得颇为得意。这套系统是非常智能的、具有生产力的,也极具未来感,纳德拉希望微软将来经历的一切都将掌控在他的领导之下。
纳德拉表示,无论我们将来在哪儿工作,微软都将会在其中拥有一席之地。微软公司于今年三月展现的“对话即平台”(Conversation as a platform)战略,就体现了该公司在豪赌一项业务——基于聊天的互动界面将取代应用(app)成为我们使用互联网的主要方式,未来用户将使用新的聊天界面来查找信息、购物、使用其它服务。与此同时,有了微软提供的”认知 API”,应用以后会越来越智能,将来,微软所使用的这种“认知APIs”将能够识别照片和视频中的人脸、表情以及包含的其它信息。
微软认为,经过近二十年在机器学习和自然语言处理方面的进展,微软已经拥有最好的“大脑”,可以帮助微软缔造一个由人工智能驱动的美好未来。微软在打造与用户进行情感共鸣的智能设备方面已经先人一步,并率先在中国市场进行了测试。在几大科技巨头中,微软是第一家针对文本聊天界面而发布真正平台的公司——这是值得在智能手机兴起过程中,一直靠边站,没啥参与度的微软引以为豪的一点。
在手机市场上遭遇滑铁卢的微软能否赢得下一场战役?
◆ ◆ ◆
今年1月,The Verge曾发布文章描述了科技行业寻找杀手级智能设备的消息。此后的几个月中,业界大小公司都加速了在此方面的努力步伐。Facebook启动了自己的智能聊天设备研发平台,搭载其具有人气的Messenger聊天应用。谷歌也宣布了自己的新智能助手,代号为“Allo”,而且还将推出一款智能对话应用“Home”,与亚马逊的Echo展开竞争。与此同时,Echo的语音输入信息功能已经吸引了不少开发者,据报道,这款产品也已经入驻300多万家庭,而且还通过其API新增了1200多个“技能”。
微软对其在API方面的工作感到非常自豪,它急于向外界传递着这一次想赢的愿望。今年6月,微软邀请我到其园区,采访纳德拉的一些顶尖得力干将,这些人正试图将人工智能融入公司业务的方方面面。在之后的两天中,微软向我展示了在自然语言处理和机器学习方面取得进展的各种各样的应用。
公司和之前一样,谈论着一个巨大的游戏,微软的历史性的关于技术精准的本能。但是公司有扔一个球,看它如何反应的历史记录。它看到在手机和小报的前景,比如,在他同龄人之前很久就知道。但是苹果和谷歌也在和微软竞争。公司的关于AI的努力迫在眉睫的问题很简单。公司和以往一样,都知道这是一场硬仗。微软对技术走向的精准把握历来已久,但是,在针对科技行业发展趋势而采取行动方面,微软则出现了一些失误之处。例如,微软很早就比竞争对手们看到了智能机和平板电脑的巨大商机,但在最终的产品开发方面,微软却最终被苹果和谷歌。围绕着公司在人工智能方面努力的问题很简单:
微软公司这次怎么不走寻常路了?为什么这次不一样?
◆ ◆ ◆
微软或许已经有比美国其他公司更成功的机器人,但是你可能没有意识到,它是从中国有了成功的开始的或许,与美国的任何一家公司相比,微软在打造聊天机器方面似乎更成功。但是,人们可能没有注意到这一点,因为微软的这一成功始于中国市场。
在2016年2月,一个微软人工智能的作品出现在这个晨间新闻,当播报员切换到天气预报,播报“小冰”。这个冰在微软长期运营的搜索引擎中,但是这个冰的模式更有话题性。2016年1月,微软的一位人工智能产品出现在上海东方卫视的早间新闻中。当时,东方卫视在播放天气预报时,用小冰代替了原有的天气预报员。小冰这个名字的发音与微软必应「Bing」发音相似,必应是微软的一个搜索引擎。但是这个小冰更加健谈。
摄像机切换到一个虚拟的平台,面孔变成了一个手机里的影像,有着好听的女声,小冰分享了她的播报,甚至回答了抛出来的问题。摄像头切换到了虚拟平台前一个动画圆上。小冰的脸换成了麦克风图像,用柔柔的女性嗓音播报天气,甚至回答了屏幕边角上的问题。
我们发现一个可以用新方式工作的填满所有我们对话中的承诺的机器人“我们已经找到了一款聊天应用,这款应用以一种全新的方式工作,能够实现诸多的对话潜力。”
◆ ◆ ◆
如果你想去了解为什么微软在机器人方面如此顽固,小冰是答案里很重要的一部分,我们发现一个可以用新方式工作的填满所有我们对话中的承诺的机器人,搜索引擎总工程师Derrick Connell说。如果你想知道,微软为何能够在聊天机器人方面拥有如此骄人的成绩,那么“小冰”就是最好的一个答案。微软必应搜索工程业务主管德里克·康奈尔(Derrick Connell)表示,“现在我还不敢说我们已经研发出杀手级的聊天应用——但是,我们已经找到了一款聊天应用,这款应用以一种全新的方式工作,能够实现诸多的对话潜力。
小冰,是2014年微软介绍中国app微信,可以回答简单的问题,就像小冰在对话方面超过的微软虚拟助理Cortana。这个机器人被设计对情绪敏感,可以记忆起过去的对话,刚刚经历一段分手?小冰将问你你怎么样了。2014年,微软曾通过中国的消息应用“微信”推出了“小冰”。小冰能够回答一些简单的问题,这有点像微软的虚拟现实助手Cortana。但是,小冰比Cortana更加出色的地方就是对话功能。这个智能聊天设备对情绪非常敏感,而且还能够记住用户此前的聊天情况。正经历分手?小冰也许能够查探出来,并会问你还好吗。
在可使用3天之后,小兵增加了150万的对话在中国软件微信上,后来在微博上也拿来用。现在四千万人在使用这个机器人,而且平均对话是人机交互26次。开通三天后, 小冰在微信上的聊天累计达 150 万次。,后来还吸引了中国大量微博用户的关注。小冰也成了最具人气的名人帐号。如今,这款智能聊天应用已经被4000多万用户使用,与每个用户的平均聊天多达 26 轮。
对Connell来说,小冰指出了下一个搜索时代,一个疑问不是出来10条超链接答案,最好的对话机器人将直接给出正确答案。对康奈尔而言,小冰也为推进下一代搜索服务指明了方向。传统的网络搜索会反馈一个网页,页面会包含有10 条蓝色超链接的搜索结果。然而,这个更加完美的对话机器人应用可能会通过语音这种简单的回答方式为用户答疑。
当然,在中国的成功可能不能复制到美国。微软的第一个英文机器人产品,在小冰出现两年后出现,尽管没有相当的英文机器人迫切的出现,微软首席执行官说,小冰的这个惊喜代表了公司重要的机遇。当然,微软智能聊天应用在中国市场的成功并不一定表明其也能在美国市场取得成功。例如,微软在美国市场推出的首款英语聊天机器人“Tay”,在与用户的聊天试验中就遭遇滑铁卢。如今,小冰面世已有两年的时间了,然而,这款智能聊天机器人却仍不具备同等的英语聊天能力,而且近期可能也不会得到大幅改进。不过,微软高管却认为,小冰背后的基础架构却表明该公司在此方面孕育着巨大机会。
◆ ◆ ◆
我们想让它成为一个生态系统
康奈尔表示,“这是一个现代化的时代——用户不需要成为演讲和理解语言方面的专家。只要使用一款工具,用我们的工具打造自己的智能聊天设备,并将其放到相应的场景之中——可能在‘Slack’应用上,也可能在‘Facebook Messenger’应用上,我们还希望是在Skype或Windows之上,当然,所有的这一切都依赖用户自己的选择。
而且在开发者的担心下,将会在机器人标准上出现一场战争,微软已经进行了非常规外交,它今年6月在旧金山组织了一个会议提升机器人制作商之间的合作。我们对合作非常感兴趣,我们希望成为一个生态系统,微软的组织这两日大会的高级工程师Lili Cheng说。(它被叫做僵尸网络)它更像一个我们发现了而且一提解决的挑战。不过,开发者也越来越担心,有关智能聊天机器人的标准之争也将展开激烈斗争,为此,微软的外交却一反常态。今年6月,微软在旧金山组织了一次会议,倡导智能聊天应用制造商之间开展更多的合作。微软高级工程师程莉莉(Lili Cheng)帮助组织了此次为期两天的会议,她表示,“我们对智能聊天设备的可互操作性非常感兴趣,我们希望这是一个生态系统。今后极有可能的情况是,我们需要找到各方合作面临的问题和挑战,并齐心协力加以解决。”
◆ ◆ ◆
但是在这次事件,比如僵尸网络之前,微软希望定位自己为机器的操控者,如果成功的话,将会有一个全新的开始在手机领域。机器人的力量在公司的技术中将会展现,在世界上最收欢迎的信息交流app上,给微软一个可以立足的获利的新世界但是微软希望通过类似这样只能聊天设备的大会让自己置于这场智能变革的中心。如果微软成功了,它将会在移动领域展开新的篇章。在微软的技术的驱动下,机器人能出现在世界上最流行的消息应用中,从而使微软在这个新世界里有一个有利可图的立足点。
当然,微软不是唯一想定义平台到下一个计算机时代,如果对话将会成为哪个新平台。每一个专业技术公司和初创型公司,都在做AI,并且有一个令人印象深刻的结论,但是对比AI在各公司,他们都很难去实现它,像谷歌,facebook,亚马逊的工作都仍停留在某一放开的阶段。当问及如何区分出他们的AI,他们都闪烁其词。谷歌的CEO Sundar Pichai,说,比如,只是简单说公司为此已经做了很久努力。当然,微软不是唯一一家尝试为下一代计算建立定义平台的公司——如果对话最终会变成那个平台的话。所有主要的技术公司和一群初创公司都在打造人工智能分支,所取得的成果也常常会令人印象深刻。但是值得一提的是,要在各大公司的人工智能技术间分个高下很难,甚至做出这样的比较也几乎是不可能的。因为很多像谷歌、Facebook 和亚马逊这样的公司对公司目前的工作都讳莫如深。当被问及他们在做的人工智能有什么区别时,这些高管们总会闪烁其词。比如谷歌 CEO Sundar Pichai 总会避重就轻地说,我们的人工智能工作已经开展“很久”了。
在风险投资公司上班的居住的未来主义者Benedict Evans在最近的博客说,AI的未来仍然不确定,这个领域走的如此之快以至于很难说最强的在哪里,或是哪里是与众不同的位置,尽管大多的计算机科学关于这些技术已经是开源的了,但是实现却是重要的,这些技术还是不必须的商品。常驻风投公司 Andreessen Horowitz 的未来主义者 Benedict Evans 最近在博客中写道:未来的人工智能发展走向还不清楚。“这个领域发展得非常快,很难说哪一块必然能成为最强大的一支,什么东西将会变成商品,以及最强的差异在哪里。”他写道,“即便围绕这些技术的计算机科学大部分都正被发布和开放了原始码,但其实施也不是一件小事——这些技术还不一定会成为商品。”
◆ ◆ ◆
所有的主要科技公司都在为这场战斗做准备
Qi Lu很高兴为微软的竞争优势做案例,Lu是一群在Nadella的高级领导团队,督查公司的应用和服务,他还是一个有20多更授权的计算机博士,这使他回想起他之前说的话。几分钟后,我开始明白为什么他在讲话时不耐烦的跺脚,就好像他为自己不能像思考那样快速的说话感到沮丧。当我们看到他穿着袜子套着凉鞋,穿着短裤和写着“让传奇去死”字样的T恤。负责公司应用与服务团队的微软高管陆奇(Qi Lu)表示,就微软的竞争优势而言,他感到非常满意。陆奇也是一位计算机科学博士,名下已经拥有20多项专利。我从与他同行的对话中了解到,他也备受同行们的尊敬。在交流了一段时间之后,我终于发现其中的原因了——他是一个非常具有才智的人。我们会见时,他穿着凉鞋,配着袜子,身着短裤和T恤,T恤衫上写着一句话——“做伟大的事情”。
Lu以追溯第一波手机网络浪潮的劣势开始,网络拥堵的比例从手机设备开始就从未超过台式机拥堵,影射了使用者的失望。我们知道网络在手机上并没有真正工作,他说。而且外界的便捷的主要种类,使用者拒绝下载app。西雅图居民肯被邀请下载app仅仅是去核对他们几年前运输的货物,当然还有更好的模型。我们的产业没有一个平台发动整体的价值关于手机和云端,Lu说,App基本上不是一个好模板。陆奇开始总结第一波移动互联网带来的不利局面。他称,来自移动设备的网络流量比值一直没有超过台式设备,这反映了用户对移动互联网的一种失落感。陆奇表示,“我们知道网络并非真正地是在手机上有效。”从很大程度上来说,用户似乎不愿意下载应用。西雅图的居民可能会被要求下载某一款应用,目的只是为了要检查一下他们多次乘坐的渡轮的票价情况——当然,应用会有更好的模式。陆奇又表示,“我们的行业一直没有发现一个能够展示移动和云计算完整价值的体验平台。从根本上而言,应用并非正确的模式。”
App带来一个界面的代替在基于html的网站。因为他们在那段时间是我们做的到的最好的,你可以寻找你想要看到的在网络上用你的手机,所以开发者研究复杂的隐藏的管道,只让你看到一个圆按钮就能交互。这些按钮仍是最有效的方法让事情很好的解决。也归功自然语言进程,现在,你可以从手机上上网搜你想要的东西了。Lu说,下一个时代“经历平台”将从这里用对话开启,它适应更多自然语言在人类如何做出反应上。如果你使其开始,你也使这些大的发光的按钮关掉。我们看到了使用语言做基底,但是使用图解在相互作用的思想上,有意义的方式上,去提升经验,他这样说道。应用只是以代替基于HTML的网络的交互界面而崛起,因为应用是我们此时能够做得好好的方式。你可能无法通过语音的方式将你从互联网上获得的内容输入到手机当中,于是,开发者打造了成熟的隐藏式产品,从而让你通过巨大的图形按钮来与手机进行互动。这种按钮仍然是完成诸多任务的最有效途径。但是,由于自然语言处理技术的进步,如今你们也真正能够通过语音方式将从互联网上获得的内容输入到手机之中。陆奇声称,下一代“体验平台”就将从那里起步,就通过人机对话开始。这将更加自然地与人类的一切行为方式相融合。而且,如果用户做对的话,那他们就可以充分利用各种按钮。陆奇还称,“我们已经看到用户在全方位地将语言当作一种基本方式来改善这种体验,而且还以更加成熟的方式使用图形互动功能。”
当拼图逐渐拼好,我们便知微软为何如此乐观。
◆ ◆ ◆
“但想要赢得这场战争,” 陆说,“公司需要这五样‘关键资产‘。第一样是一个‘对话平台’,以供人们进行大量交谈或者简讯。微软拥有Office 组件, Outlook, Skype, 以及Cortana。第二样是人工智能‘大脑‘ —— 一个复杂的精神性的世界模型。微软指出其在研发人工智能上已经进行了将近20年的努力。第三样是能够访问社交图谱 —— 由于人们在互联网上得活动常常涉及他们的朋友与同事。并非巧合的是,我见到陆的几天后,微软便宣布将斥资 262亿美金收购领英,以及其拥有的4.33注册用户。陆奇还表示,对企业而言,要想在这些领域取胜的话,还需要五大“关键要素”。第一大要素就是“对话场景”——在这里,用户可以进行大量的对话和文本消息进行交流。在这方面,微软拥有Office、Outlook、Skype以及Cortana等。第二个要素就是人工智能“大脑”——这是一种非常成熟的大脑模式,微软声称其自己的人工智能措施可以追溯到20年之前。第三个要素就是要能利用社交图谱——人们在互联网上的活动往往涉及他们的好友和同事。并非巧合的是,在我会见了陆奇后的几天,微软宣布该公司将斥资262亿美元收购LinkedIn及LinkedIn的4.33亿注册用户。第四个要素就是能够操作人工智能业务的平台。微软拥有Windows和一系列类似设备,特别是Xbox。最后一大要素就是渴望在你平台上打造应用以及愿意为购买优先权而向你付费的开发者网络。激发开发者在此方面的兴趣也一直是今年三月份微软Build开发者大会的主要目标。
第四样是可供人工智能运行的平台。微软已经拥有了Windows和一整套设备,尤其是Xbox 游戏机。而最后一样是一群急于在你平台上构建的开发者网络,他们还要为了获得这项许可而向你付费。三月份微软构建开发者大会的首要目标便是激发这种兴趣。第四个是一个人工智能运行平台。微软有 Windows 和一系列设备,其中值得注意的是 Xbox。最后一个是开发者迫切想在用户平台上建立的一个网络,并且会为这项特权付费。如何激发用户兴趣一直是微软在三月举办的 Microsoft Build 开发者大会的首要目标。
将这些资产拆分开来看,微软具有很强的竞争对手。 按理说由于其一系列的简讯app, 脸书拥有更强大的对话平台。毋庸置疑它拥有最强大的社交图谱。 谷歌的“大脑”可能更聪明,而且它能够广泛访问数以万计的安卓设备。 但当这些资产拼凑成一张完整的地图,你就能看出微软为什么那么乐观了。 “我们拥有全部这些资产,”陆说,“我相信我们拥有引领未来的关键”。单从其中的某一个要素来看,微软也面临着强劲的竞争对手。事实上,Facebook就拥有更加强大的人机对话场景,而且还具有自主研发的大量消息应用,同时该公司还拥有最大的社交图谱。谷歌的“大脑”或许更加智能,而且谷歌还能够接触到数亿部Android设备。不过,就总体情况而言,微软似乎要乐观得多。对此,陆奇表示,“把所有的要素加起来,我认为,我们完全拥有主导未来的实力。”
◆ ◆ ◆
大脑
微软对人工智能的拥戴始于两年前的第一次代码会议。(第二年的会议由Vox媒体举办,该公司拥有The Verge. )在这次会议上, 成为微软CEO仅3个月的纳德拉出现在舞台上讨论微软的未来。在他发言的最后,他展示了Skype的一个新功能: 有两个微软的员工上台讲话,但是其中一个讲英文,另一个讲德语。而Skype实时翻译了他们的对话,这让语言障碍不再成为交流的阻碍。这个演示令人印象深刻。 而纳德拉也宣布,到今年年底这项演示将作为产品推出。微软全力支持人工智能早在两年前的年度就已经开始了。在当时召开的Code Conference大会上,刚刚担任微软首席执行官三个月的纳德拉登台演讲,阐述了微软的未来远景。纳德拉在演讲结束之际,展示了Skype的一些功能。随后,另外两名微软员工也登台演讲,一位讲英语,一位讲德语,而Skype则实时翻译他们的演讲内容,从而让他们无障碍地与听众互动。这样的展示给业界留下了深刻的印象——就在当年底,纳德拉宣布这将成为一件工作产品。
对于位于雷德蒙德的Skype团队来说,纳德拉的发布时间轴就像一个炸弹。 “对我来说这完全是个惊喜,” 微软研究部副总裁彼得·李说。 “由于Skype翻译这件事,萨特亚真把我们关进了监狱。”首先,团队有两个主要顾虑。一个是微软研究部历史上从未把产品推向过市场,并且研究人员担心他们会突然间失去追求科学突破的自由。在返回微软总部之后,纳德拉就对Skype研发团队下达了命令,要求尽快将此产品推向市场。负责微软研究业务的企业副总裁彼得·李(Peter Lee)表示,“对我而言,这的确是一个大意外。萨蒂亚的确是用这个Skype Translator把我套牢了。”最初,研发团队一直存在两大担忧。其一是,微软研究团队历史上一直没有将产品推向市场的任务,研究人员担心,他们会因此而突然没有什么自由来追寻科学上的突破与进展。
另一个顾虑是,演示时Skype翻译地不是很好。该公司的语言模型一直是基于大量的正式发言 —— 就比方说来自联合国的宣言。但Skype所需要翻译的双向沟通对话非常不同。这产生了很多的“不流利” —— 比如音响忽略一个字时,又或者从头翻译一次时。有时还有“代码混合”—— 也就是音响在一句话中使用了不同的语言,尽管这在除了英语的其他语言中很常见。然后就是唱歌 –虽然人们经常给彼此唱歌,但电脑却很难解析。其二是,在展示时,Skype Translator表现不太好。微软公司的语言模式一直是使用大量正式的演讲内容来测试——例如来自联合国的演讲内容等。但是,Skype需要用来翻译的这种双轨式交流却大不相同。当然,Skype在翻译时还存在更多的“不流畅”局面——特别是当发言者说错某个词时,或者重复某句话时。另外还会出现“编程混乱”的情况——当发言者在一个句子中使用多种语言时。此外,当人们相互对话出现嘈杂之音时,Skype Translator在翻译时就显得非常困难。
“基本没什么顺利的,”李说。“我们必须重新培训我们的所有模型。”但李的团队却为纳德拉所欢呼雀跃,并且他们当年12月就发布了预告 。明年该产品将被广泛(并免费)提供。李显然赞同纳德拉是个“激进主义者”,但他最后也承认这个项目令人振奋。 “想象一下,当你终于意识到一切事情都不怎么顺利时,你会恐惧,会士气低下 —— 但你必须以某种方式让大家重振旗鼓,”李说“这样做时,你会看到惊人的新事物出现的。” “基本上,没什么是顺利的,”Lee 说。“我们能做的只是再次训练我们所有的模型”。但是 Lee 的团队重整旗鼓,拥护Nadella,于当年十二月发布了预告。明年这个产品就会在市场上和大家见面了。Lee 赞赏 Nadella 为“活动家”,他说最终这个项目做得很愉快。“想象一下,当你意识工作没有一点进展时,你必须以某种方式让人们重整士气和排除恐惧,”Lee 说。“当你做到时,你会看到一些让人惊讶的新东西。”
但这也并非全是空话。毕竟现在微软可以翻译八种不同语言之间的对话 —— 这可是56种不同的组合。并且其背后技术的应用不止局限于翻译领域。你想知道一个难以置信,甚至神奇般有用的网络机器人吗?微软正在对能够记录商务会议并且实时产生记录单的软件进行beta测试。这种软件同样也能够把两个人之间的采访录音,并产生一份能够区别这两个人对话的记录单 —— 这也许是有史以来记者都梦寐以求的高科技产品。这种说法感觉上并不夸张。微软如今能够将八种不同语言之间的相互对话(相当于56组对话)翻译出来,其背后的技术影响力已经超越了翻译本身。你想听听一个具有令人难以置信的作用的智能聊天设备说话吗?微软正在测试记录商业会议内容并能够实时整理内容文稿的软件。也就是说,同样的软件也能够记录两人之间的采访声音内容,并整理出相关的文稿,或许,这将成为任何记者都非常向往的技术产品。
“刚刚着手进行 Skype的翻译工作时, 我们真的非常沮丧,因为一切都不怎么顺利,”李说。 “但现在我们正努力翻越那座山,毕竟我们拥有这些演讲,这些翻译模型,尤其是演讲模型 - 他们好到令人惊奇”。李表示,“无法向你们描述,当我们最初研发时发现Skype Translator的一切工作都无济于事的,我们是何等悲伤。但如今,我们正在攀登高峰,我们正在改进这些演讲和翻译模型,特别是演讲模型——他们好得出奇。”
◆ ◆ ◆
Clippy的复仇
同时,微软将大量人工智能资源注入它的一些重大产品中,如:Windows 和 Office。人工智能的一大前景在于它可以预测你的需求——这是Google Now的基本创意。它能在你解锁手机时将交通、天气和体育赛事的比分信息推送给你。
微软在研究将这种人工智能纳入台式产品的方法。负责Cortana开发的Marcus Ash 向我展示了一款模仿版的Windows,该系统能基于云推理预测我可能想知道什么。Ash打开开始菜单后,Cortana会弹出一系列建议行动:对你有意义的名字、你最近打开过的文档、常见法语单词的释义(该用户计划去法国旅行)。得到允许后,Cortana将整合你的联系人、网络搜索历史和应用使用情况等信息,并给出相应建议。
而且这还会随着时间而变化,例如,应用开发者可以预测这些应用是在上午或是用餐时间发挥作用。Ash 说:“这种利用人机对话、以及在用户允许后利用与用户相关的信息而使用户更快速行动的创意,让你感觉自己被控制了,然而这恰是让我们兴奋的东西。许多用户体验工作日趋简化,减少摩擦,并真正展现人工智能的力量。”
Ash 最喜欢一个名为“承诺”的应用。得到你允许后,Outlook会记录你老板要求你在周末前发给她一些东西,如果你没做到就会自动提醒你。Ash 说:“我的生活很混乱,容易忘事,尤其是邮件。“他说他最近忘了回复老板的要求,但是Cortana 及时提醒了他。
当我与Office营销业务的企业副总裁Kirk Koenigsbauer会面时,我看到更多类似情况。他向我展示了各种智能使Office更便捷使用的方法。2014年9月,微软推出Delve,将其内置在Office 365中,这是一款便捷工具,有点类似于Fitbit的功能。这款应用能分析用户在电子邮件及会议上花费的时间, 并在日历上标注用户为了做那些更为复杂、更有意义的工作而延长的工时。它会统计收件人实际看邮件的比例,以及看邮件的速度。它还会建议用户与一段时间没有通邮件的同事们联络。此外,这款应用甚至还会向用户显示同事以及自己回复电子邮件的时间。
◆ ◆ ◆
如果你所在的机构像硅谷许多大公司一样使用谷歌应用,浏览Delve时可能会有意外发现。你不需要像一个呆子一样寻找这类有用的信息。如果你是一个经理,仅瞟一眼,你就可以知道在过去一周你在每位员工身上花费的时间。这种智能不像普通人工智能一样那样好,不能预测你所有需求,但是它有自己的作用。并且相比之下,它使谷歌应用看起来像是一个可以忽略的东西。
花了六个月时间搜寻杀手级智能聊天设备之后,我对这一概念仍然抱乐观态度。这种智能设备所能进行的交互量比将要取代的1-800 号码和被遗忘的小商业网站要大得多。不过,我一直对我们在Facebook Messenger、Telegram等平台上看到的诸多内容感到失望。每次我都觉得这是使用互联网的最慢方式。大多看起来功能仅比 SmarterChild 时代的 AOL 即时通讯机器人多,并且它们通过古董的按钮图形界面输入。如今围绕智能聊天应用和人工智能的讨论仍然受到业界打造可盈利新平台的愿望所鼓舞,而不是消费者对这些服务的需求。
◆ ◆ ◆
目前一些公司针对这一问题的答复是,他们已经在研发满足消费者需求的应用。Facebook首席技术官Mike Schroepfer说:“与诸多先进技术一样,人们认为这种智能技术已经出现。事实上还有许多技术和工作有待研发。我认为日复一日、年复一年,我们肯定能取得进步。”
拜访微软后,我一直想知道我在这个问题上是不是错了。基于聊天的交互界面一般都很单调沉闷,但是支撑它们的机器学习技术以及用户已经在使用的工具却很强大。如果微软能够将Delve类智能融合到更广泛的服务中,那么完全有理由相信该公司可以提供世界上最具生产力的产品组合。尽管微软努力打造支持智能聊天机器人所需大平台的愿望还没真正实现,但这种愿望却蕴含着巨大的价值。或许,智能聊天机器人在早期的公开表现还让人非常失望,但是当智能聊天机器人在后台工作时,它们仿佛施了点魔法。
◆ ◆ ◆
与此同时,微软正在将人工智能的资源投入到它最大的特许经营权上:Windows系统与Office组件。人工智能的承诺之一便是它能够满足你的需求 —— 而现在这正是谷歌的基础理念,在你解锁手机的那一刻它就向你提供了交通,天气,和体育比分。
微软正在努力把这种人工智能搭建进桌面。 负责Cortana发展的马库斯·艾什向我的展示了Windows的一个先期模拟版本,此版本大量从云端推断我可能想知道的事情。当艾什访问开始菜单时,柯塔娜提出了一系列建议行动:比如那些对你有意义的名字,你最近使用过的文件,甚至推荐了对常见法语词汇的翻译。(用户即将旅行。)如果你允许的话,Cortana将把你的联络人资料,网页搜索记录,还有app使用量所产生的数据都整合到它的推荐中。
它的推荐甚至会依照一天中的不同时间而改变 —— 比如说应用程序开发人员可以示意说他们在早上有用,或者晚饭时间。 “这种通过对话,通过你的语境信息,在得到你的许可时让你更高效,并且让你拥有控制权权的理念,才是真正使我们兴奋的东西,”艾什说。 “我们很多用户体验的工作就是关于简化,关于消除摩擦,并展示人工智能的真正力量。“
◆ ◆ ◆
艾什最喜欢的例子之一叫做“承诺”。如果你允许,Outlook会帮你记下你的老板要求你在本周内提供给她的东西 ——如果你不回应它还会自动提醒你。 “我的生活很复杂,我很容易忘记的东西 ——尤其是电邮中的事,”艾什说。他说最近他忘了回复自己的老板,但Cortana及时通知他解决了这个问题。
当我与柯克·柯尼斯鲍尔,Office的市场部副总裁见面时,我见到了更多这种事情。他向我展示了智能将Office 组件变得更易使用的一系列方式。2014年9月微软推出Delve,这相当于一个针对提高生产力Fitbit, 并且附带在Office 365中。这款app分析你花在电子邮件及会议上的时间,并在你的日历上标示出那些你能够用来做更复杂,更有意义工作的时间段。它会告诉你你把某人的邮件设置为自动已读的频率,还有你多快就把他们设为自动已读。它会建议你联络一段时间没有邮件往来的同事。它甚至可以显示你回复你同事的时间,还有他们回复你的时间。
如果你所在的机构像许多硅谷的大公司一样依赖谷歌企业应用套件,浏览Delve感觉就像一个启示。并不只有书呆子觉得这种信息有用。如果你是一名经理,Delve扫一眼就能告诉你过去的一周你花在每个员工身上的时间。这种智能并不像是知晓你所有需求的人工智能一样性感 —— 但今天它在这里是有效的,对比起来它让谷歌的企业应用套件看起来像一个被忽视的死水滩。
在我花费6个月寻找一个杀手网络机器人后,我仍然看涨这个概念。他们所激发的互动远超过1-800个号码和被那些遗忘的,也终将被他们取代的小企业。 但我已经对很多像是 Facebook Messenger和Telegram这样的平台失望:有时它们像是使用互联网最慢的方式。它们中的大多数并不比AOL Instant Messenger这样还处于孩童时代的机器人拥有更多的功能,并且他们要求的所有输入简直是把我尖叫着送回到基于按钮的图形界面。现在关于网络机器人和人工智能的讨论仍被业界对新的盈利平台的渴望所推动,而不是消费者对他们所提供服务的需求。
当网络机器人在后台工作时,它们仿佛施了点魔法。
◆ ◆ ◆
到目前为止,很多公司对这个问题的反应基本上都是,他们正在努力。但当我五月份时问到Facebook的首席技术官麦克·施若普法时,他说, “人们以为许多这些先进的技术都已经实现了, 可是还有更多技术和工作有待开发。但我相信这会日积月累变得更好。”
然而,这次去微软的参观让我怀疑我的思考方向是否一直都错了。基于聊天的界面通常都是乏味的。但把强化它们的机器学习应用在人们已经使用的工具上,就会产生非常强大的功能 。如果微软能把Delve一样的智能应用于更广泛的服务上, 那么说它提供了世界上最强大的生产力套件也就合情合理。即使微软对于为聊天机器人搭建大规模平台的愿景永远都不能实现,这项应用也具有巨大的价值。 目前在早期阶段,出现在台前的机器人往往令人感到愚蠢。但当他们在后台工作时,我们却感觉他们在施魔法一样。
原文发布时间为:2016-07-19