《白话深度学习与TensorFlow》——2.4 深度学习应用

2.4 深度学习应用

我们在第1章所介绍过的谷歌无人驾驶汽车仅仅是深度学习的一个典型应用,深度学习的应用领域越来越多,而且是几乎在任何一个产业中都有其落地的身影。我们先来看几个有趣的应用。
2.4.1 围棋机器人——AlphaGo
击败李世石的谷歌AlphaGo就不用说了,它已经进入我们的视线很久了。
它由谷歌旗下DeepMind公司的戴维·西尔弗(David Silver)、艾佳·黄和戴密斯·哈萨比斯(Demis Hassabis)与他们的团队开发,这个程序利用价值网络(value network)去计算局面,用策略网络(policy network)去选择下子。2015年10月AlphaGo以5∶0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世界围棋冠军、职业九段选手李世石,并以4∶1的总比分获胜。2016年7月18日,世界职业围棋排名网站GoRatings公布最新世界排名,AlphaGo以3612分,超越3608分的柯洁成为新的世界第一。
AlphaGo其实是有两个“大脑”组成的,也就是两套完整的深度学习网络来进行配合计算的。
第一大脑:落子选择器(move picker)。
AlphaGo的第一个神经网络大脑是“监督学习的策略网络”,观察棋盘布局企图找到最佳的下一步。事实上,它所基于的理论仍旧是遍历一棵树。它预测每一个符合规则的下一步的最佳概率,或者说是每一步落子后获胜的概率,然后选择其中一个获胜概率最高的位置落子。这可以理解成落子选择器。

第二大脑:棋局评估器(position evaluator)。
AlphaGo的第二个大脑棋局评估器是在做另外一件事情。它可以用来评价一个盘面的好坏程度,所以这种所谓的棋局评估器就是价值网络,通过整体局面判断来辅助落子选择器。这个判断仅仅是个大概的价值评估,但对于盘面的阅读速度提高很有帮助。通过分析潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读,也就是多看几步棋。如果棋局评估器说这个特殊盘面的变种不行,那么AI就跳过阅读在这一条线上的任何更多落子,从而加快盘面阅读的速度。

在这个围棋软件的背后可以说是凝聚了大量的深度学习工程师的心血的,不过也可以说是凝聚了全世界所有围棋高手和围棋爱好者的心血。AlphaGo变得这么强悍,不是因为它天生有这么强的功能,而是因为它在不断和世界上所有的围棋高手以及围棋爱好者下棋的过程中不断进行学习和自我完善——它每天可以完成100万盘棋,甚至是让自己的“左手”跟自己的“右手”下棋,并从中总结规律。这是任何人类都无法做到的。
2.4.2 被教坏的少女——Tai.ai
同样是在2016年3月,微软在测试一款新型聊天机器人Tay.ai,不过悲剧的是这款机器人在Twitter上经过用户的不正当“调教”已经变成了“女流氓”,不仅飙脏话,还发表一些带有种族歧视的言论,最后微软不得不将其下线。
据悉,这款聊天机器人主要是定位于18~24岁的美国年轻网友,微软对机器人的交流内容并没有做任何设定,通过和网友进行对话学习,来逐渐形成自己的交流体系。用户只需在Twitter上@TayandYou就能得到Tay.ai的回复。

用户对Tay.ai似乎很感兴趣,不过出乎意料的是,在24小时之内,Tay.ai就开始被网友带坏,发布了不少攻击性的言论,让人大跌眼镜,不少网友见证了Tay.ai从腼腆少女到不良少女的转变。有人还画了一种一脸邪念的漫画来把这个“女机器人”的表现具象化。目前微软方面表示正在对这款人工智能机器人Tay.ai进行调整。
从原理分类来说,Tay.ai所基于的技术应该是RNN及其扩展领域,也就是循环神经网络recurrent neural networks,这种技术能够比较容易识别上下文关系并对其进行深度学习。但是同样是那个问题,计算机自己是极难识别“善恶美丑”的,这种对于人的三观会有较清晰划定的东西对于计算机来说确实很难。
一方面人类对抽象事物的理解本身就有优势,对于与自己三观有矛盾的东西本身就有天然的抵触性,但是计算机没有——它没有判断这种是非的能力。
另一方面,计算机学习的速度真的是快得惊人。要不怎么说一切事物都有两面性呢,即使是学坏它也比一般人学坏得快。脏话我们人一分钟学十句,人家一分钟学个十万句估计跟玩一样。所以最后实在没办法,微软只能把它下架了。
不过你也不用想太多,虽说是把机器人教坏了,也只是看上去有点坏,它的内心还是“清白”的,它自己其实根本只是在模仿人类说话,根据上下文找一句看上去“最该说的”话,但它其实并不知道自己在真的说什么。
2.4.3 本田公司的大宝贝——ASIMO
日本本田是一家世界驰名的大公司,我们现在知道更多的是本田的汽车和摩托车,而最令本田引以为豪的其实是它们公司的宝贝ASIMO——阿西莫。有兴趣的话,读者朋友们可以去访问一下本田公司的阿西莫子站点http://www.honda.co.jp/ASIMO/about/。

应该说阿西莫是目前世界上为数不多的可以以类人型出现的综合场景应用的机器人。阿西莫的身高为130cm,宽45cm,进深34cm,最大行进速度为每小时9km——可别小看,人家是可以双脚离地进行奔跑的9km啊。可以连续行走40min不用充电。

它背后的匣子就是电池,比我们平时用的手机电池大多了,不过也没办法,这么复杂的机器人不耗电才奇怪。
它的头部、腕部、手部、腰部、脚部有很多的自由关节,整个肢体合计可以有57个自由度的弯曲维度,感触极为细腻,所以他所能做的事情也是非常令人叹为观止的。

它可以打断一个人的谈话,并告知这个人有饮料送过来了。

它可以根据人的行走方向做预判,并调整自己的行进方向不要与对方发生碰撞。

即便是三个人同时说话它也能听清楚三个人分别讲述的内容并加以复述。
你以为光这样就完了吗?那可太低估人家了。

阿西莫还可以用恰当的力道把水杯盖子打开,向纸杯里倒水,你说这得多温柔。

还有就是类似踢球和上下楼这种对平衡性要求极为苛刻的事情,阿西莫也能轻松胜任。怎么样,是不是确实很厉害?
对于阿西莫的训练来说,深度学习的技术肯定是少不了了。不过除此之外更厉害的恐怕还是本田公司的各种硬件感知器技术、材料工程技术(包括电池、超导等)、自动化技术等综合领域的结合和应用。阿西莫基本代表了当今世界人形机器人制造的最高水平,目前能够做到与这个水平类似的机器人制造团队还是寥寥无几。给笔者印象最深的还是美国的Boston Dynamics公司的Atlas系列机器人,虽然样子没有阿西莫那么萌吧,但是也能够双脚行走,而且在湿滑的地面上走也不会摔倒。被人故意推倒也能站起来,还能够负重走路保持平衡,也是让人眼前一亮。

人形机器人的制造是对综合学科的应用的考验,能够进行制造和普及才能够彰显科技大国的真正实力,笔者本人也是非常期望中国能够早点出现能够与阿西莫媲美的人形机器人。

时间: 2024-10-01 11:41:30

《白话深度学习与TensorFlow》——2.4 深度学习应用的相关文章

《白话深度学习与TensorFlow》——3.2 与其他框架的对比

3.2 与其他框架的对比 1)?TensorFlow:深度学习最流行的库之一,是谷歌在深刻总结了其前身 DistBelief 的经验教训上形成的:它不仅便携.高效.可扩展,还能在不同计算机上运行:小到智能手机,大到计算机集群:它是一款轻量级的软件,可以立刻生成你的训练模型,也能重新实现它:TensorFlow有强大的社区.企业支持,因此它广泛用于从个人到企业.从初创公司到大公司等不同群体. 2)?Caffe:卷积神经网络框架,专注于卷积神经网络和图像处理,是用C++语言写成 的,执行速度非常快.

TensorFlow与主流深度学习框架对比

引言:AlphaGo在2017年年初化身Master,在弈城和野狐等平台上横扫中日韩围棋高手,取得60连胜,未尝败绩.AlphaGo背后神秘的推动力就是TensorFlow--Google于2015年11月开源的机器学习及深度学习框架. TensorFlow在2015年年底一出现就受到了极大的关注,在一个月内获得了GitHub上超过一万颗星的关注,目前在所有的机器学习.深度学习项目中排名第一,甚至在所有的Python项目中也排名第一.本文将带我们简单了解下TensorFlow,并与其他主流深度学

深度学习框架TensorFlow在Kubernetes上的实践

什么是深度学习? 深度学习这个名词听了很多次,它到底是什么东西,它背后的技术其实起源于神经网络.神经网络最早受到人类大脑工作原理的启发,我们知道人的大脑是很复杂的结构,它可以被分为很多区域,比如听觉中心.视觉中心,我在读研究中心的时候,做视频有计算机视觉研究室,做语言有语言所,语音有语音所,不同的功能在学科划分中已经分开了,这个和我们人类对大脑理解多多少少有一些关系.之后科学家发现人类大脑是一个通用的计算模型. 科学家做了这样一个实验,把小白鼠的听觉中心的神经和耳朵通路剪断,视觉输入接到听觉中心

谷歌开源深度学习系统TensorFlow 的图片文字说明模型

谷歌开源深度学习系统TensorFlow 的图片文字说明模型 责任编辑:editor007 作者:aiko |  2016-09-23 22:27:27 本文摘自:36kr   今天,谷歌宣布开源图片文字说明模型 Show and Tell,该模型具有自动生成图片文字说明的功能,准确率达 93.9%. 谷歌于 2014 年发表论文首次介绍了 Show and Tell 这一系统模型,在 2015 年又对其进行了内容更新,对相关技术做了更加准确的改进.之后,谷歌一直在完善这一技术,最终作为谷歌 T

【干货】AI 实践者需要掌握的10大深度学习方法:反向传播、迁移学习、梯度下降……

过去10年,人们对机器学习的兴趣激增.几乎每天,你都可以在各种各样的计算机科学课程.行业会议.华尔街日报等等看到有关机器学习的讨论.在所有关于机器学习的讨论中,许多人把机器学习能做的事情和他们希望机器学习做的事情混为一谈.从根本上讲,机器学习是使用算法从原始数据中提取信息,并在某种类型的模型中表示这些信息.我们使用这个模型来推断还没有建模的其他数据. 神经网络是机器学习的一种模型,它们至少有50年历史了.神经网络的基本单元是节点(node),基本上是受哺乳动物大脑中的生物神经元启发.神经元之间的

一入侯门“深”似海,深度学习深几许(深度学习入门系列之一)

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud  [导言]目前人工智能非常火爆,而深度学习则是引领这一火爆现场的"火箭".于是,有关"深度学习"的论文.书籍和网络博客汗牛充栋,但大多数这类文章都具备"高不成低不就"的特征.对于高手来说,自然是没有问题,他们本身已经具备非常"深度"的学习能力,如果他们想学习有关深度学习的技术,直接找来最新的研究论文阅读就好了.但是,对于低手(初学者)而言,

数据不够怎么训练深度学习模型?不妨试试迁移学习

深度学习大牛吴恩达曾经说过:做AI研究就像造宇宙飞船,除了充足的燃料之外,强劲的引擎也是必不可少的.假如燃料不足,则飞船就无法进入预定轨道.而引擎不够强劲,飞船甚至不能升空.类比于AI,深度学习模型就好像引擎,海量的训练数据就好像燃料,这两者对于AI而言同样缺一不可. 随着深度学习技术在机器翻译.策略游戏和自动驾驶等领域的广泛应用和流行,阻碍该技术进一步推广的一个普遍性难题也日渐凸显:训练模型所必须的海量数据难以获取. 以下是一些当前比较流行的机器学习模型和其所需的数据量,可以看到,随着模型复杂

实践指南!16位资深行业者教你如何学习使用TensorFlow

首发地址:https://yq.aliyun.com/articles/71257 更多深度文章,请关注:https://yq.aliyun.com/cloud 如何开始学习使用TensorFlow? 相关回答: Harrison Kinsley --PythonProgramming.net的创始人 TensorFlow官方网站有相当多的文档和教程,但这些往往认为读者掌握了一些机器学习和人工智能知识.除了知道ML和AI,你也应该对Python编程语言非常熟练.因此,在开始学习如何使用Tenso

Tensorflow 全网最全学习资料汇总之Tensorflow 的入门与安装【2】

自2015年11月发布以来,谷歌旗下的机器学习开源框架TensorFlow已经在图像识别,大数据分析,语音识别和语义理解,机器翻译等各个领域得到了广泛应用,同时也得到了业内人士的普遍认可,成为了目前最受关注和使用率最高的开源框架之一. 本文将重点整理TensorFlow框架的入门和安装教程.更多关于TensorFlow的深入介绍.应用项目以及各机器学习开源框架之间的对比等内容,请见雷锋网的系列文章. 下面是本文整理的资料内容: 在安装之前,这里先列出一些对TensorFlow给出大略介绍的文章,

TensorFlow 全网最全学习资料汇总之TensorFlow的技术应用【4】

随着谷歌2015年发布开源人工智能系统TensorFlow,让本就如火如荼的深度学习再添一把火,截至现在,TensorFlow已经历了多个版本演进,功能不断完善,AI开发者也能灵活自如的运用TensorFlow解决一些实际问题,下面雷锋网会对一些比较实用的TensorFlow应用做相关整理,让大家对TensorFlow有理性和感性的双层认知. TensorFlow在图像识别中的应用 对人类而言,区分画面.图像就如同与生俱来一样简单,例如我们能够轻松的识别老虎与雄狮的区别,但如果把这个问题交给计算