2016年4月15日晚上,北京大学研究生会、北京大学燕新社联合Xtecher共同主办“未名对话”系列讲座之一——“对话人工智能”。人工智能专家、北京大学教授谭营发表演讲,主题为《人工智能漫谈》。
演讲嘉宾:谭营,北京大学计算智能实验室创建人、烟花算法发明人。
本文整理:Xtecher特稿记者 凌云
以下为谭营教授演讲实录:
人工智能的起源
说起人工智能,它的思想萌芽可以追溯到17世纪的巴斯卡和莱布尼茨,他们萌生了有智能的机器的想法。
19世纪,英国数学家布尔和摩尔根提出了“思维定律”,机器是不是应该有思想?在19世纪,英国科学家巴贝奇还发明了第一架“计算机器”,成为人工智能发展的最早硬件,认为这是能够把人的智能寄托于机器的一个手段。
但是真正把人工智能作为一种科学来研究,要追溯到M-P模型。这是神经网络最著名的一个模型,是Mcculloch和Pitts(1943年)提出来的。为什么说这个模型奠定了人工智能的基础呢?因为这是第一次对我们人脑神经元系统进行建模。目前人工智能研究领域里非常火的一个模型——“深度神经网络”的最基本的单元还没有离开M-P模型。
除了M-P模型以外,还有Heb学习规则,这是一个让机器具有学习能力的最基本的原理。那么,现在的非监督学习基本还是沿用了这个Heb学习规则。
再一个比较有名的就是Perceptron。Perceptron是美国心理学家Rosenblatt提出来的一个系统,这个模型可以实现一定的分类功能。在当时,Perceptron就比较火,而且掀起了人工智能的第一次高潮。
那么,“人工智能”(Artificial Intelligence)这个词第一次是在哪儿提出来的呢?
是在1956年达特茅斯(Dartmouth)会议上。有几个比较有影响的科学家,像Misnky还有McCarthy,他们在会议上经过讨论,最后提出了这么一个概念。“人工智能”真正是从这个时候开始叫的。在以前,大家都不叫这个名字,有把它叫做perceptron的,有把它叫神经网络的,还有等等其他很多的名词。
那么,从1956年这个Dartmouth会议过后,人工智能就登大雅之堂了。到目前,正好是一甲子(60年)。现在全世界很多研究人工智能的一些协会和机构都在筹备活动,来纪念AI诞生60周年,我们国家在这个月下旬可能也要在北京开个会。
在人工智能研究过程中,一个比较重要的人物就是阿兰·图灵。他是第一位比较明确地提出计算机是不是有智能这么一个概念。
阿兰·图灵认为机器可以模拟人脑思维过程;一个良好设计的计算机能够做到人脑所能做的一切。因此,也有人把他称为“人工智能之父”。现在大家真正比较认可的“人工智能之父”还是McCarthy,是他提出了人工智能这个名字。
图灵有一个最著名的测试,叫“图灵测试”,就是判定一个机器是不是有智能。在图灵测试里,有一个提问者提出问题,回答问题的一边是人,一边是机器。如果这个提问者分不清回答问题的人到底是人还是机器的话,那么就认为机器具有人工智能。这是判断机器有没有人工智能,但还没有回答什么是智能。
那么,真正的人工智能是什么?
我给了一个回答,就是:让机器去做需要人类智能才可以做的那些事情。
比如,AlphaGo这个程序可以下围棋,可以完成人需要非常高的智能水平完成的一些工作,就是一个典型的人工智能的运用。
那么,在专业术语里面,一般把人工智能定义为“认识、模拟和扩展人的自然智能,目的是为人类服务”。换一句话说,我们研究人工智能主要是去做什么事呢?模拟我们自然智能,然后扩展或者加速我们人类智能的发展,把它提高到更高的水平,我们最终是要把这些技术应用于生产过程或者来提高我们人的生活质量,来为我们人类服务。
人工智能的发展历程
人工智能的发展经历了一个螺旋式上升的发展路线,非常曲折。人工智能里面派系复杂,发展起起伏伏,一会儿是这派占了上风,打倒了另一派;过阵子,另一派又打倒了原来的那一派。
我们把它整个的发展历程梳理一下,会发现有三大派别——符号主义学派、联接主义学派和行为主义学派。前两个派别是最主流的发展学派,而且这两个学派之间互不买账,互相贬低对方。
▼符号主义学派——基于规则推理
传统的人工智能,基于规则推理。我刚才提到的几个人物,Misnky、McCarthy、Nillsson这些人实际上就是参加1956年达特茅斯会议的组织者。也就是说在五六十年代,当人工智能这个词一出来,当时占主流的是符号主义学派,是他们在支配人工智能的发展。
▼联接主义学派——模拟神经网络
联结主义学派也是起起落落。五六十年代,是它的低潮,正好被符号主义学派打压下去;到80年代是它的第一次复兴;到90年代初,它又进入瓶颈;现在又进行了第二次胜利,是联接主义学派受到追捧的时代。
▼行为主义学派——进化主义或控制论
始于六七十年代,以Wiener(通信原理、雷达系统的奠基人)为代表,就是做控制论,演化控制,实际上是世界二次大战的需求,当时得到了很广泛的发展。
人工智能的研究内容
作为一个学科,人工智能主要从这几个方面进行了深入的研究。
在方法层面,有启发式搜索和推理,这个是建立在知识和知识工程的基础上,从方法层面来讲,应该归于符号主义学派。还有模式识别、机器学习和生物激发方法(计算智能)等是当今或者说近二三十年获得广泛研究和追捧的方法。尤其是机器学习和计算智能,是人工智能研究的热点和前沿。
在应用层面,实际上有很多。像自然语言理解,我们说的自然语言。原来我们认为这些是有智能的人才能做,那么机器实际上现在也能做,能识别语音,能进行翻译。还有数据库的检查检索系统、专家系统、机器定理证明等。现在在我们的图像识别、语音识别以及计算视觉等领域已经取得了非常多的进展。这都是人工智能在应用层面的一些工作。
计算智能的研究(Computational Intelligence)
下面我来说一说现在人工智能发展最前沿的一个研究——计算智能的研究。在计算智能里面,它主要是通过计算智能的方法来实现人类智能。
计算智能现在作为一门学科,主要包括了人工神经网络、模糊逻辑、进化计算、群体智能还有人工生命等领域。
那么计算智能跟传统的人工智能的区别在哪里呢?
传统的人工智能,我们谈的就是基于符号的,然后以知识信息为基础,通过逻辑推理来进行处理。因为当时传统人工智能的想法是人的思维比较高级、比较高等,需要用一些高水平的方法,需要用符号,需要严密的逻辑推理才能实现。这个时候的基本思路是自顶向下。
而计算智能实际上是以数据为基础,通过数值计算进行求解。现在计算手段飞速发展,为计算智能的深入研究提供了很好的手段,所以计算智能得到了非常广泛的发展。
▼人工神经网络
在计算智能里面,研究最早、认识最为广泛的之一的领域就是人工神经网络。
左边是一个生物神经元,神经元之间是有突触连接的,而且这个突触连接是可以调整的,那么通过调整这个连接,就可以去感受输入的信号或者是输出的信号的变化。
人工神经网络实际上就是对生物神经网络进行建模。这个模型实际上就是最早我提到的M-P模型,把神经元都排列起来,组成了这么一个网状结构,有多输入、多输出,它们之间是有分层的,之间是一个全连接状态,这么一个网络就是一个最简单的神经网络,我们把它称为“多层神经网络”。这个是应用最广泛、也潜力巨大的神经网络模型。其实,我们现在的深度神经网络也是建立在这么一个模型的基础上。
▼复杂优化问题
在计算智能里面,还有一大类是要求解一个复杂优化问题。实际上,我们在求解实际问题的时候,任何一个问题都可以等效为一个复杂优化问题来求解。那么我们能不能有一个有效的方法能够在最快的速度找到这个最优值——全局最优点,而不受其他局部最优值的影响?这个是现在计算智能的一个热点问题、通用问题,也是一大类要研究的方法。
一个典型方法是遗传算法。遗传算法是模拟生物体的遗传进化过程,通过对环境的适应能力的大小来进行“适者生存、优胜劣汰”。那么,这个过程是一个优选过程,可以用于求解十分复杂的优化问题,所以它是研究计算智能最主要的方法之一。
除此之外,我们在研究人工智能里面还有一大类,就是生物群体表现出来的一些非常强大的能力。个体可能很简单,你像一只鸟很简单,但是一群鸟却能够在非常恶劣的环境下生存下来,这是为什么?这也是我们现在在研究的群体智能。
还有,五年前,我根据烟花爆炸在空中形成的美丽图案而发展的一个空间搜索的新方法,叫做烟花算法。它实际上在求解优化问题方面已经比现在流行的很多方法要好。现在(烟花算法算出)的结果基本上是最好的一个结果。
机器学习的研究(Machine Learning)
机器学习是什么?就是我们让机器能够像人一样学习。机器有自我更新的能力。我们可以造成一个机器出来,在我们普通人眼里,机器造出来什么样,那它就只能是这个样子,对不对?但是我们对机器赋予了学习能力,那它就可以改进自己的性能。机器学习实际上就是经过经验提高自身系统性能的一个过程,或者我们叫“系统自我改进”。
原来我们把机器学习归为人工智能的一个分支,但现在的观点是,机器学习基本可以独立出来了,专门作为一套求解复杂问题的方法来使用,不一定要跟人工智能扯上关系。当然,它和人工智能是有很多交叉的。
那么机器学习为什么会有这么神奇的一个能力呢?实际上,机器学习从原理上讲还是非常简单的。
令W是这个给定世界的有限或无限所有对象的集合,由于观察能力的限制,我们只能获得这个世界的一个有限的子集Q⊂W,称为样本集。机器学习就是根据这个有限样本集Q,推算这个世界的模型,使得其对这个世界为真。
这个Q是个很小的部分,然后这个W是我们求解问题的整个搜索空间,就我们刚才谈到的一个复杂问题的整个空间。这个空间很大,可以是我们到目前为止不可能穷尽搜索的一个大的空间,也可以是无限大。
比如,下围棋的搜索空间也是非常庞大,现在的计算资源是不可能进行穷尽搜索的,如果能穷尽搜索的话,那我们就不需要这种智能方法。
正由于我们计算能力有限,所以在整个搜索空间里面,我们只能得到很少一部分的知识,就是说每个人的自身经验只是非常小的一部分。然后我们利用已有的这部分知识,或者将知识进行提炼,建立这个模型。
建立起的这个模型对于我们的经验肯定是适合的,对不对?因为这是从我们的经验中建立起来的。但是我们希望建立的这个模型要对我们没见过的事情同样有效,这就叫做泛化。
也就说,我们可以让这个机器学习我们给它的经验和知识,但是它不能只是在我们的这些知识上工作,而应该具有更强大的能力,从而体现出机器学习的作用。这就是机器学习的过程。那么泛化就在这起到了非常重要的作用。而从这个数据来建模的过程,就是机器学习最重要的一个方面。不论多么重要的模型,都是在做这件事,都是从Q到W的过程。
在机器学习里面,主流看法分成两类。
▼浅层学习(Shallow Learning)
模型采用的就是单层的网络。这个是80年代进行广泛研究的,而且我们把它作为机器学习的第一次浪潮。
最初比较典型的方法是多层感知器(Multi-layer Perceptron)。当神经网络研究到一定程度,我们发现多层感知器的性能提不高,受到很多限制,泛化性能不好,便转而研究像支撑向量机(SVM)、Boosting、随机森林(Random Forest)、ELM等其他方法,但都没有离开神经网络的层数只有一层。
▼深度学习(Deep Learning)
2006年,Geoffrey Hinton在《科学》杂志上发表了一篇文章,提出了深度学习的概念。也就是说,神经网络应该不止一层,应该多层,而且每一层能表达概念的抽象程度是不一样的,表达知识复杂程度也是不一样的,这是它最基本的一个观点。
第一,多层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类。
第二,它最主要的是有一个预训练,这是它的一个重大贡献,由此掀起了机器学习的第二个浪潮。
从上图我们可以看一下,同样是训练10^6次,如果加入了预训练,性能可以急剧提高(错误低于没有预训练的情况)。这意味着深度神经网络加上预训练再进行监督训练的这种方式,可以找到更优的全局最优点。很复杂的函数可能平时找到的是局部最优点,如果我们经过了事先预训练,再进行监督训练,那么这种训练方式可以大大提高性能。
同样,我们把它用来做图片当中物体的识别。我们知道人是具有很强大的识别能力,给你一张图片,能识别出来里面是一个猫还是一个香蕉。用机器来识别一个物体,以前的神经网络SVM在2010年最高做到72%的正确率,2011年做到74%,但是现在实际上已经到99%。所以说,提高得非常快,因为我们现在网络更复杂,计算资源更好,可以利用这种深度学习的表达能力,对这类复杂的、需要我们人去鉴别才能完成的智能工作都可以要求机器来完成。
当前人工智能的热点
▼人脸识别
我们见一个人,马上就能记住他的脸,下次见到很快就能识别出来。那么人具有很强大的识别能力。
以前,我们用计算机尝试做人脸识别系统,识别效率都不高。由于深度神经网的应用,香港中文大学教授汤晓鸥带领他的团队开发了一个名为“Deep ID”的深度学习模型,现在可以在LFW(Labeled Faces In the Wild)数据库上做到99.15%的识别率,这是有史以来首次超过99%的LFW识别率,超过人类肉眼的识别能力。
▼围棋人机大战
简单说一说AlphaGo与李世石之间人机大战的博弈机理。
AlphaGo里面主要是组合了这四个策略。一个是蒙特·卡洛(Monte Carlo)的搜索树(Search Tree)方法,再加上监督学习(Supervised Learning)和强化学习(Reinforcement Learning),然后整个是建立在深度神经网络(Deep Neural Networks)的基础上,是建立在一个13层的卷积神经网络上来实现的。
AlphaGo的聪明之处有这么几点:
第一,使用监督学习的策略网络(SL Policy Network),这是一个非常好的起点。整个程序的起点是从人类下棋的经验当中学习,先把人类最精华的部分学到手。
第二,使用一个快速提升算法,叫强化学习的策略网络(RL Policy Network)去提升自己的能力。
最后,使用一个有效的评价策略,我们把它叫做强化学习的价值网络(RL Value Networks),来计算每一步的结果。
那么这几点相互协作,共同来完成一个非常需要智力水平的围棋模拟。
在《自然》上发表的一篇研究文章显示AlphaGo已经达到了业余三段,这个结论是根据AlphaGo和樊辉对弈的结果而得出的,实际上,现在的AlphaGo比起之前可以再让四个子,已经达到人类围棋十五段的样子。
这是一个机器学习的方法,是一个可以逐渐提升继续提高的过程,所以能达到非常高的智能水平。
▼预测比赛结果
上个礼拜,阿里云做了一个小AI的人工智能程序,进行了《我是歌手4》的歌王预测。实际上它也预测出来了。
目前,小Ai的学习速度是人类的1万倍。要成为某一领域的专家,如果人类需要10万小时,则小Ai只需要10小时。
它声称可以做到理解人类的情感,这个实际上它还做不到。所谓的理解情感,只是从网络上搜集其他人的评价,它并不是去听音乐。
实际上,现在最有挑战性的是让计算机去识别音乐的好坏。这个很难识别,因为只有人才能听懂这个音乐,只有人才能感觉这个音乐好听还是不好听。要机器去听它,机器可能按一定规则来,但是人是按心情来的,所以这是非常难、复杂的一件事情。
对人工智能发展的几点思考
人工智能的发展现在正以一个前所未有的速度在往前发展,更多的惊喜在不断地涌现。而且AI技术的应用会广泛深入到我们生活的方方面面,逐渐地将我们人类社会推到前所未有的智能社会的高度。
当然,在这个发展过程当中,跟其他任何技术发展是一样的,都要满足和遵循我们所施加给它的人类社会的规范和行为准则,否则,可能对我们人类社会的发展产生一些不利的影响。
结束语
人工智能是一门多学科交叉的综合性前沿学科,在理论上很不成熟,技术上逐渐突破,应用上正在快速扩展和渗透;基于各种生物原理与过程的激发是其继续前进的源泉,人类社会的需求是其不断发展的动力!
原文发布时间为:2016-04-25