中国人工智能学会通讯——无人驾驶的图灵测试

今天谈一谈智能驾驶。我讲一下智能车做好了怎么测,怎么使得它具有拿到驾照的水平。我报告的题目是《无人驾驶的图灵测试》。

做什么东西要把评测搞清楚。怎么测,我们一直讲智能代理,智能代理或者认知它的方法是什么?阿兰• 图灵先生在他年轻时就在想这个事情,他提出了图灵测试。几十年过去了,人们已经把图灵测试研究透了,有人说图灵测试漏洞太多了不好测;有人认为图灵测试做了很大的贡献。直到今天,人工智能经过两个寒冬以后,我们看人工智能带来的变化。首先是脑科学,然后是认知心理学,接着是神经生物学。这三个学科对于人智能的启发更大一点,我们把它们叫做脑认知。脑认知启发的人工智能就是目前研究的对象,这一块怎么测,按照图灵的说法,拿对话来测,用一个人和一个机器人对话,看看我们能不能知道它是人的声音,还是机器的声音。听起来很简单,但是有多少智商。比如你回答问题时是否得体、交谈时带不带情感;你是沮丧的沟通,还是愉悦的沟通,所以这件事情并不那么简单。

1950年图灵写了一篇文章,可以看出来,图灵测试本质上就是交互智能的测试。一直到2014年,聊天机器人尤金•古斯特曼发布了。还有做诗,给你一个上下联对横批,分别不出来是人做的,还是机器人做的,是不是可以说这是图灵测试。但是有一个问题,你的打油诗是水平很高的诗,这个智能是怎么测试的。今天上午微软报告特别强调了在语音方面的智能处理;麻省计算机实验室做了一个机器制作的声音的实验,把物体碰撞的不同声音,把一个特定人的声音让机器人产生,达到了以假乱真的目的。如果我们用大数据、用深度学习训练一个机器人,让它达到某个特定人的说话水平,它发出的声音就是虚拟组织的声音,这个事情我们以前表演过,我记得科大讯飞做过这样的演示。

还有一个很重要的事情,像中小学生写作文,有一个批改网,10 000人、100万人同时写一篇文章,看看哪篇文章拿冠军。这时候有机器人阅卷,跟人的阅卷有什么差别?怎么样实时地交互,批改这个作文?怎么样打分?还要形成评语,都能达到以假乱真的程度。所以,图灵测试又被提上了话题。尤其重要的是,最近全世界都在做智能驾驶、无人驾驶,驾驶驱动的图灵测试怎么测。如果我们在路上看到一台汽车,你是否分辨不出是机器人开的还是人开的?你是否分辨不出一个新手或者是老司机?是A驾照还是C驾照?图灵测试在后图灵时代已经进入了我们的生活。

谷歌公司是无人驾驶的领头羊,2015年就声称跑了100万英里,达到人类75年的驾龄。但是遇到了一个最基本的问题,无人车上路怎么样获得驾照,驾驶认知度量已经成为交管部门当务之急的问题;对我们科技工作者来说,脑认知如何度量,这是一个非常重要的科学问题。假如我们把图灵测试的这个人变成一个自动驾驶仪,你区别不出是智能驾驶的汽车,还是无人驾驶,那能不能叫图灵测试?如果测试者坐在直升飞机上,看交通流,车子往前走,你区别不出哪一辆车是人开的,哪一辆车是机器人开的,可不可以说就达到了人的水平?图灵测试进入日常生活,进入寻常老百姓家已经不奇怪了,这里列出了一大堆需要我们识别的测试。比如网上聊天机器人,你用语句搜索,它把答案变成语音还给你。因为出现了搜索引擎和语音智能的发展,使我们随时可以听到声音,这到底是人跟我们聊天,还是机器人跟我们聊天;是机器人跟我说话,还是人在说话;是机器人在翻译,还是人在翻译,所以这就涉及到图灵测试的问题。远程医疗把我们可穿戴的传感设备、把你的物理参数送上去以后,它给你开的药方,怎么知道是专家开的,还是机器人开的;你在家里时,孩子在网上做辅导或者咨询,你怎么知道这个辅导老师是人,还是机器人,等等。所以,图灵测试进入日常生活,人类已经进入后图灵的图灵测试。无论是机器对话、机器写诗,还是自动驾驶,有一点必须坚持,那就是允许测试者现场监督和交互,测试者可以现场改变红绿灯,看看车能不能停下来;可以制造一个干扰的汽车障碍,看看能不能避障。所以现场介入的交互是必须的。我们拿驾照时,当你路考时,同样两个人,水平差不多,一个人拿到驾照了,一个人没有拿到驾照,考官说你不行,你刚才超车时头没有往后看,我们规定头要往后看的,所以下次再考;但是你态度好一点,你记住了,这一次过了就可以了。所以我们认为,图灵测试本质上尽管存在客观性,但是必然带有主观性,如果一个驾驶员老不合格,这就会受到质疑,何况驾照还可以收回,所以对图灵测试应该用这样的观点来看。

驾驶图灵测试的现实意义非常重要,随着机器换人时代的到来,有这样一个问题,相比较而言,汽车自动化程度比较高,一个驾驶员怎么样通过方向盘油门的动作改变习惯的,常年考驾照的测试,已经积累了丰富的经验,驾驶图灵测试可以成为图灵测试的起始点。汽车工程师学会有一个非常自动驾驶的等级区分,分成L0~L5,上面两个是人驾驶,下面三个是机器人驾驶。有的厂家宣称我要做L4的自动驾驶,有人说我只能做L3。我觉得辅助驾驶挺好,所以有一个问题,就是图灵测试的问题。自动驾驶的等级转换点如何度量?掌握权交界点如何度量?5级分类可操作点在哪里?要规定100个驾驶窗口还是1 000个驾驶窗口?这还真是一个问题。我们在北京可以看到很多特斯拉的车,有的卖80万,有的卖120万,你问驾驶员你自动驾驶了吗?基本上没有。因为特斯拉声称是L2等级,需要驾驶员的手放在方向盘上,保持注意力,如果不这样干,出了事还是驾驶员的。苹果公司在加州测试是1 000英里,0.2次干预,也就是北京到深圳来回一趟只干2次,所以图灵测试的问题是一个现实的问题。

人的智商到底是怎么样表现的,生物学家告诉我们,在微观、宏观维度上有不同的表现。比如,当我们看台子上写的人工智能,你脑子里的兴奋区也许在这个地方;当你耳朵里听到人工智能这个词兴奋度在这个地方;什么也没有听说,你自己想,兴奋区就更多了。所以告诉大家,记忆很重要,一个驾驶员头脑里记录了多少场景,能够应付多少事件,怎么学习的,这点很重要。再一个,当你看周围场景时,驾驶员是有选择性注意的,同样一个场景,小孩子和一个经验驾驶员看,注意点是不一样的。我们很多人都做机器视觉,有人说是计算机视觉,确切说是图像的处理和理解,我们叫做先视后觉,它无特定的任务驱动,所以我们进行分类、聚类,进行一些识别,形成一个全局的认知,现在很火。但是人类认知难道都是这样的吗?不是的,因为我们在做无人驾驶时,有一条坚定的信念,叫做传感器不完美,是我们确定的一条原则,不要想着哪个传感器是完美无缺的,分布在车体各部位都认为看到了全局。生物视觉和机器视觉的差别,观而不觉,无视后觉,边视边觉,先觉后视。生物视觉选择性注意当中,我们经常听到,大范围优先,或者大尺度有限。当你看一幅图时,大图很重要,细微的地方并不重视,这是优先点不重要。还有,当你看到一个图像时,掉下来的部分你很注意,这是一个圆的、方的、长的,还有一种差异优先。我们的问题是,在选择注意力时,这几个问题碰到一起到底谁优先。我们研究的结果认为,真正的是记忆优先。你头脑里记忆的东西对当前情景会发生很大的注意,上午很多人研究感知的智能,没有人研究认知的智能,对不起,我们就在研究认知的智能。脑认知的主要外面表示在如何听说和如何看;脑认知的内涵是想,想的时候有记忆认知、计算认知和交互认知三种认知。我在一个场合说了一点计算机负面的话,我们人类对计算机的追求有一点贪得无厌,现在这么快,我们还要更快,但是我们没有用精力研究记忆和交互,这是一个遗憾。我们在研究计算的同时,应该花更多的精力研究记忆和交互,这才是受脑认知启发的人工智能。

我们认为,人类认知没有你想的那么复杂,用一句话、一件事情反复地装进你的头脑里,你就形成了自己的认知。记忆是脑认知的核心,遗忘是人类智能的显著表现,没有遗忘脑子将不堪重负。神经生物学家告诉我们,人类记忆是分区的,瞬间记忆,工作记忆,场景记忆,有不同的划分的区域和方法。遗忘是对记忆的不能再认和回忆,因此我们应该研究遗忘、记忆和存储。认知过程可用卷积表征体现出来。我个人定义了一个很重要的公式,记忆是认知函数和遗忘记忆的卷积。我提出用认知学的物理方法研究人的遗忘,一个图片怎么实现遗忘的?在你的记忆里怎么恢复的?这件事情应该下决心研究清楚。感觉记忆是非常丰富的,但是也是瞬间的;工作记忆是在海马体里面,它和学习有很大的关联。大脑皮层的记忆已经被抽象化了,所以人工智能的学者不能简单研究计算,还要研究记忆;不但要研究学习和遗忘,还要研究三个不同记忆区的划分方法。要研究工作记忆和场景记忆,怎么样帮助当前的瞬间感知?人脑的计算没有什么复杂的变化,就是一种相似计算,是我们复杂化了。交互是脑认知的重要形态,交互的力度不一样,各有各的不同,怎么样实现转换?人在神经网络交互的同时,还有与外面世界的交互,获得心得感知,所以交互只有二重性。对于无人驾驶来说,你要从人的驾驶认知必须回答的问题,人脑是如何定位的。大家都知道,做无人驾驶最难的技术,就是实时定位,我们把大的坐标系叫做上帝坐标系,每个人看的都一样,我们的智能体是以它为基础的认知,因此我们提出对周边环境进行实时定位,以及影射,这样才能知道我这辆车当前应该在什么地方采取什么动作。语言我们认为是图像认知在不同抽象中的语义标注,要构造不同尺度连接组的,三位一体的多个多层的卷积网络。

这时候我们看看计算机的局限性,计算机最主要的是CPU,脑认知的单元每层都有记忆智能、计算智能和交互智能,这样才能建立起来。我们的观点和特斯拉不一样,和谷歌有区别,和英特尔也有不同,我们认为八个字——“无人驾驶,难在拟人”。无人驾驶不仅仅是车,不是做自动化就可以了,自动化遇到了天花板,人工智能来了。

我们有一点感叹,现在的汽车可以做到100马力甚至更高,但是汽车真的不如马的认知,马是认知主体,老马识途,车不如马。现在无人驾驶遇到最大的痛点就是最后1公里,回不来。共享单车回不来,将来共享汽车,最后1公里回不来,共享汽车的商业化用途就无解。因此要想实现无人驾驶为主的驾驶,最根本的问题到底是解决车,还是解决人。我们发出一点不同的声音,如果做解决车的问题,就把车的自动化做好,我们做一个软件定义的机器,实现无人驾驶;如果解决人的问题,那就必须具有记忆、决策和行为能力的认知主体,进行自主驾驶,一字之差,差之毫厘。自动化学者和人工智能学者是有不同的观点的。汽车的行为是由驾驶员决定的,无人驾驶难在拟人,因此我们要研究驾驶员行为学和驾驶员心理学。当在爆胎时,驾驶员的动作恰当吗?我们要研究驾驶员的感知、记忆、控制和行为技巧,而不是一味地改良车辆动力学性能,实现自动驾驶。

我们看看驾驶员的行为学和心理学,这张图是在自动驾驶之前,在交通运输里就有的,专门研究驾驶员的行为学和心理学,分为感知域、认知域和行为域。现在把感知智能适应以后的结果演化成驾驶透视图,通过深度学习或者算法,实现对方向盘和油门的控制;然后我们把驾驶员的驾驶技巧——怎么样省油,坐着舒服,就是有技巧的驾驶,怎么样使这个车子开的平稳。我们自然科学基金会组织全国八九次的比赛,考虑到裁判指标、图灵测试的指标,我们检测4个S,靠这4个S形成图灵测试,拿出一个表,决定谁是冠军、谁是亚军。现在我们在做认知领域的深度学习,驾驶认知的核心是学习还是记忆,生活是记忆,驾驶也是记忆,驾驶员开车时都是在算账吗?所以记忆很重要,每次驾驶都会结合对过去驾驶的记忆。学习是什么,学习是理解知识、形成记忆的交互过程;理解是信息的认知或已有认知的结果;而记忆弥散在神经网络之中。不去研究这样的问题,做出的决策和结果出路不大。驾驶员的经验和临场处理能力必须由驾驶员自己替代。我们现在开始往记忆和交互上发展,当然计算也是很重要的。有的单位说我们做一个机器人操作系统,用它支撑驾驶员,操作系统ROS固然重要,但是它不能代表驾驶员。如果要说驾驶员的注意力,释放驾驶员的认知,必须有一个物化驾驶员的认知。我们把特定的驾驶认知叫做驾驶脑,这样一来就会注意力集中,永远专注,永不疲劳,原来驾驶员发生的事故称之为人类第一杀手,也就不再存在,这该多好。

驾驶认知。自动驾驶是机器驾驶,它物化了驾驶员的认识,实现了无人驾驶。我们想一想,自动驾驶如果是在地铁比较好,因为铁路是它的,还有网络调度;如果是高铁,也可以做自动驾驶,因为道路是封闭的,调度能力很强;如果是飞机也可以做自动驾驶,唯独汽车不行。因为汽车是你个人的代步工具,它在开放不确定性的环境下,常常会遇到大雪、大雾、大雨。比如说冰雪,还有人为的红绿灯失效、道路施工、车辆醉驾等,如果不具备处理这些能力,做自动驾驶可能难以胜任。有经验的驾驶员、标杆驾驶员能够灵活处置,自动驾驶车怎么样学习呢?这是我们研究的重点。一个小孩能够成功抓住一只球,这是计算出来了吗?不是;是用了什么算法吗?也不是。一次又一次的学习、操练,久而久之,智能成为新的本领。我们认为,开车和学英语本质上是相同的,熟练的司机开车,如同自己走路一样自然,开多了,不是每天都在计算。经验驾驶员,不但要符合驾规,安全行驶,我们还要使车子坐起来比较舒服,从A点到B点怎么样舒服、省油,这也是驾驶员重要的技巧。因此,我们发明了一个单词——Driving Brain,不同的人开车行为习惯不一样,我们认为自驾车应该有个性,好像我们每个人开车都有个性一样,如果你不强调开车的水平,我们可以找标杆驾驶员开车,这也是可以的。驾驶技能的习得通常通过认知、关联、自主三个因素决定。如果像特斯拉一样,把传感器放在车里,让人工开车,开了两年以后,拿回来一学习,再放回去让它和你开车一样。在路上的行为就成了自己的行为,人的感知和车的行为达到了合一的境界,这是我们追求的目标。

我们十多年自动驾驶的生涯告诉我们,这件事情很重要,如果没有的话,我们仍然会恐慌、迷茫,今天做的很好的,明天可能就做不好了。感知认知和行为有一个比较好的反馈过程,从动态感知到态势分解、到自主决策,这个期间场景记忆、功能记忆都起到很重要的作用。四类传感器,分别是激光雷达、摄像头传感器,还有车姿传感器,还有GPS传感器,这代表我们的感知系统。而认知系统里,既有驾驶技术,还有各种各样的记忆棒;我们利用当前的驾驶态势和时间序列表决策当前的认知,形成认知箭头,控制车的动力和行为,这块叫做小脑,因为它已经有驾驶技巧了,从感知到认知到行动,再感知到认知到行动。可先利用微电子技术,采用GPU+CPU+FPGA+ASIC机构,生产专用芯片和板卡。2016年研发的驾驶脑V1.0,原来开始开车准备时间十几分钟,现在我们开车启动时间只要22秒。我们终于开始自己的发明,就是驾驶脑,它是给你拿驾照的,它是给你积累驾驶技能的,它是买路熟的,它是个性化驾驶和标杆驾驶,这些东西怎么靠自动驾驶完成的?这就是我们在全世界自动驾驶的浪潮中发出了自己微弱的声音。我们认为,人工智能的使命是加速汽车向人机交互的转变。有了驾驶脑,有可能使汽车成为驾驶员自己,这是我们人类追求非常有理想、有意义的科技。我们很多人买聊天机器人,我们想汽车也应该是这样的。智能驾驶专用实验与评估环境,全国已经批准了7个实验场,这很有可能发展成为赛车手和赛车机器人的赛车场。

机器人换人带来一个新的行业,就是后图灵时代,也许是人机共生、共融、共发展的时候了。如果人脑的特定问题域的认知能力可以先局部地得到解决,比如驾驶问题、写作问题、学英语问题等;如果我们做一个流动大巴车,我们安排一个驾驶脑,安排一个聊天脑,不但会开车还会导游,这样下去,千千万万个特定的机器人认知脑,通过移动互联网、云计算和大数据,是不是可以倒逼变成一个通用的人工智能?或者强人工智能?我们一起来拭目以待!

(本报告根据速记整理)

时间: 2024-10-16 04:23:41

中国人工智能学会通讯——无人驾驶的图灵测试的相关文章

中国人工智能学会通讯——智创未来 未来已来

2016 年带着我们难忘的记忆,就这样翻篇了.由我们学会发起.全国多个组织积极参与的.纪念全球人工智能 60 年的一个个系列活动历历在目,在我们身边发生的种种无人驾驶的比赛和试验活动还在让我们激动不已,AlphaGo 战胜人类围棋冠军李世石的震荡被 Master 的新战绩推向又一个新高潮,时间就这样把我们带入了新的一年--2017 年. 对 2017 年的人工智能,我们会有什么期待呢? 深度学习会火 无人驾驶会火 机器人产业会火 机器同传会火 人机博弈会火 交互认知会火 不确定性人工智能会火 智

中国人工智能学会通讯——着力突破与创新 实现超越与引领

提 要 2016年3月,围棋人机大战的结果,在舆论界激起了惊涛骇浪:在科技界也引起了强烈反响.为了把握人工智能的发展现状和规律,探讨我国人工智能的发展战略,在中国人工智能学会和众多人工智能同行的支持下,由本文作者出面申请了一次高层战略研讨会,这就是以"发展人工智能,引领科技创新"为主题的香山科学会议.与会者同气相求.同心协力,站在国家战略的高度,以纵览全球的视野,通过深入的研讨和论证,凝聚了诸多宝贵的共识,形成了直送中央的<关于加快发展我国人工智能的专家建议>.本文简要介绍

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智

中国人工智能学会通讯——2016机器智能前沿论坛召开

2016 年 12 月 17 日,由中国人工智能学会.中国工程院战略咨询中心主办,今日头条.IEEE<计算科学评论>协办的"2016机器智能前沿论坛"暨"2016 BYTE CUP国际机器学习竞赛颁奖仪式"在中国工程院举办.论坛嘉宾包括中外顶尖的数据挖掘.机器学习,以及自然语言处理方向的专家学者. 与以往不同,本次论坛除介绍机器学习的重大进展和应用外,还着重讨论了机器学习技术在媒体数据上的应用,并为2016 BYTE CUP 国际机器学习竞赛的获奖选手进

中国人工智能学会通讯——Master虽优势较多 但仍有缺陷

近日,Master 在各大围棋网站横扫顶尖职业棋手,随后,谷歌 DeepMind 创始人德米什 • 哈萨比斯在 Twitter 上发布消息,证实了 Master 是 AlphaGo 的升级版.众所周知,围棋困难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆:同时状态空间大,也没有全局的结构.这两点加起来,迫使目前计算机只能用穷举法,并且因此进展缓慢.但人能下得好,能在几百个选择中知道哪几个位置值得考虑,说明它的估值函数是有规律的.这些规律远远不是几条简单公式所能概括,但所需的信息量

中国人工智能学会通讯——混合智能概念与新进展

脑科学以阐明脑的工作原理为目标,近年来已成为最重要的科学前沿领域之一.脑功能计算.脑智能模仿再度成为学术界和产业界热议话题[1-4].欧盟.美国.日本相继启动了大型脑研究计划,强有力推动了人们对脑结构.脑功能和脑智能的探索和认识:另一方面,人工智能研究风起云涌,最近一个标志性事件是谷歌的AlphaGo以4:1战胜围棋世界冠军李世石[5],实现了围棋人工智能领域史无前例的突破.2016年9月斯坦福大学发布了<2030年的人工智能与生活>报告[6],全面评估了当前人工智能的进展.挑战.机遇与展望.