2.4 深度学习应用
我们在第1章所介绍过的谷歌无人驾驶汽车仅仅是深度学习的一个典型应用,深度学习的应用领域越来越多,而且是几乎在任何一个产业中都有其落地的身影。我们先来看几个有趣的应用。
2.4.1 围棋机器人——AlphaGo
击败李世石的谷歌AlphaGo就不用说了,它已经进入我们的视线很久了。
它由谷歌旗下DeepMind公司的戴维·西尔弗(David Silver)、艾佳·黄和戴密斯·哈萨比斯(Demis Hassabis)与他们的团队开发,这个程序利用价值网络(value network)去计算局面,用策略网络(policy network)去选择下子。2015年10月AlphaGo以5∶0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世界围棋冠军、职业九段选手李世石,并以4∶1的总比分获胜。2016年7月18日,世界职业围棋排名网站GoRatings公布最新世界排名,AlphaGo以3612分,超越3608分的柯洁成为新的世界第一。
AlphaGo其实是有两个“大脑”组成的,也就是两套完整的深度学习网络来进行配合计算的。
第一大脑:落子选择器(move picker)。
AlphaGo的第一个神经网络大脑是“监督学习的策略网络”,观察棋盘布局企图找到最佳的下一步。事实上,它所基于的理论仍旧是遍历一棵树。它预测每一个符合规则的下一步的最佳概率,或者说是每一步落子后获胜的概率,然后选择其中一个获胜概率最高的位置落子。这可以理解成落子选择器。
第二大脑:棋局评估器(position evaluator)。
AlphaGo的第二个大脑棋局评估器是在做另外一件事情。它可以用来评价一个盘面的好坏程度,所以这种所谓的棋局评估器就是价值网络,通过整体局面判断来辅助落子选择器。这个判断仅仅是个大概的价值评估,但对于盘面的阅读速度提高很有帮助。通过分析潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读,也就是多看几步棋。如果棋局评估器说这个特殊盘面的变种不行,那么AI就跳过阅读在这一条线上的任何更多落子,从而加快盘面阅读的速度。
在这个围棋软件的背后可以说是凝聚了大量的深度学习工程师的心血的,不过也可以说是凝聚了全世界所有围棋高手和围棋爱好者的心血。AlphaGo变得这么强悍,不是因为它天生有这么强的功能,而是因为它在不断和世界上所有的围棋高手以及围棋爱好者下棋的过程中不断进行学习和自我完善——它每天可以完成100万盘棋,甚至是让自己的“左手”跟自己的“右手”下棋,并从中总结规律。这是任何人类都无法做到的。
2.4.2 被教坏的少女——Tai.ai
同样是在2016年3月,微软在测试一款新型聊天机器人Tay.ai,不过悲剧的是这款机器人在Twitter上经过用户的不正当“调教”已经变成了“女流氓”,不仅飙脏话,还发表一些带有种族歧视的言论,最后微软不得不将其下线。
据悉,这款聊天机器人主要是定位于18~24岁的美国年轻网友,微软对机器人的交流内容并没有做任何设定,通过和网友进行对话学习,来逐渐形成自己的交流体系。用户只需在Twitter上@TayandYou就能得到Tay.ai的回复。
用户对Tay.ai似乎很感兴趣,不过出乎意料的是,在24小时之内,Tay.ai就开始被网友带坏,发布了不少攻击性的言论,让人大跌眼镜,不少网友见证了Tay.ai从腼腆少女到不良少女的转变。有人还画了一种一脸邪念的漫画来把这个“女机器人”的表现具象化。目前微软方面表示正在对这款人工智能机器人Tay.ai进行调整。
从原理分类来说,Tay.ai所基于的技术应该是RNN及其扩展领域,也就是循环神经网络recurrent neural networks,这种技术能够比较容易识别上下文关系并对其进行深度学习。但是同样是那个问题,计算机自己是极难识别“善恶美丑”的,这种对于人的三观会有较清晰划定的东西对于计算机来说确实很难。
一方面人类对抽象事物的理解本身就有优势,对于与自己三观有矛盾的东西本身就有天然的抵触性,但是计算机没有——它没有判断这种是非的能力。
另一方面,计算机学习的速度真的是快得惊人。要不怎么说一切事物都有两面性呢,即使是学坏它也比一般人学坏得快。脏话我们人一分钟学十句,人家一分钟学个十万句估计跟玩一样。所以最后实在没办法,微软只能把它下架了。
不过你也不用想太多,虽说是把机器人教坏了,也只是看上去有点坏,它的内心还是“清白”的,它自己其实根本只是在模仿人类说话,根据上下文找一句看上去“最该说的”话,但它其实并不知道自己在真的说什么。
2.4.3 本田公司的大宝贝——ASIMO
日本本田是一家世界驰名的大公司,我们现在知道更多的是本田的汽车和摩托车,而最令本田引以为豪的其实是它们公司的宝贝ASIMO——阿西莫。有兴趣的话,读者朋友们可以去访问一下本田公司的阿西莫子站点http://www.honda.co.jp/ASIMO/about/。
应该说阿西莫是目前世界上为数不多的可以以类人型出现的综合场景应用的机器人。阿西莫的身高为130cm,宽45cm,进深34cm,最大行进速度为每小时9km——可别小看,人家是可以双脚离地进行奔跑的9km啊。可以连续行走40min不用充电。
它背后的匣子就是电池,比我们平时用的手机电池大多了,不过也没办法,这么复杂的机器人不耗电才奇怪。
它的头部、腕部、手部、腰部、脚部有很多的自由关节,整个肢体合计可以有57个自由度的弯曲维度,感触极为细腻,所以他所能做的事情也是非常令人叹为观止的。
它可以根据人的行走方向做预判,并调整自己的行进方向不要与对方发生碰撞。
即便是三个人同时说话它也能听清楚三个人分别讲述的内容并加以复述。
你以为光这样就完了吗?那可太低估人家了。
阿西莫还可以用恰当的力道把水杯盖子打开,向纸杯里倒水,你说这得多温柔。
还有就是类似踢球和上下楼这种对平衡性要求极为苛刻的事情,阿西莫也能轻松胜任。怎么样,是不是确实很厉害?
对于阿西莫的训练来说,深度学习的技术肯定是少不了了。不过除此之外更厉害的恐怕还是本田公司的各种硬件感知器技术、材料工程技术(包括电池、超导等)、自动化技术等综合领域的结合和应用。阿西莫基本代表了当今世界人形机器人制造的最高水平,目前能够做到与这个水平类似的机器人制造团队还是寥寥无几。给笔者印象最深的还是美国的Boston Dynamics公司的Atlas系列机器人,虽然样子没有阿西莫那么萌吧,但是也能够双脚行走,而且在湿滑的地面上走也不会摔倒。被人故意推倒也能站起来,还能够负重走路保持平衡,也是让人眼前一亮。
人形机器人的制造是对综合学科的应用的考验,能够进行制造和普及才能够彰显科技大国的真正实力,笔者本人也是非常期望中国能够早点出现能够与阿西莫媲美的人形机器人。