人类的智能是经典的还是量子的?
如果不是量子的,那量子智能是什么样的,将超越经典智能多少?
在新智元AI WORLD 2017世界人工智能大会上,阿里云量子技术首席科学家、之江实验室副主任施尧耘在他名为《量子智能》的演讲中回答了这两个主要问题。这是一场烧脑的演讲,为了方便阅读,我们给出一份简单的大纲:
定义“智能”
量子信息处理简介
- 基础知识
- 量子状态
- 量子存储、操作和读取
- 量子电路
- 为什么量子计算比经典计算更快?
- 确定计算
- 随机计算
- 量子计算
人类智能是经典的还是量子的?
- 软件
- 硬件
量子智能
- 量子智能是否存在?
- 量子智能是怎样的
施尧耘:人类智能是不是量子的?如果是的话,在哪里是量子的,我们如何利用它?如果不是,那有没有量子的智能,量子智能是什么样的,比人类的智能强多少?我叫施尧耘,我来自阿里巴巴,来自阿里云,也来自之江实验室。我之前在密歇根大学任教。非常感谢杨静女士和新智元给我这个机会来和大家讨论这些问题。
我之所以说“讨论”,并不是故意谦虚,因为我不能够声称自己是个智能研究者,我到现在还没有写过人工智能方面的论文。所以,这个议题对我来讲也是个挑战,我非常勇敢地接受了这个挑战,在这个过程中也学到了很多知识,今天抛出一些想法,不一定成熟,希望大家多批评。
既然我不是智能研究者,我希望先把我说的“智能”圈定好。在这个报告里,“智能”指的是信息处理的过程,或者说某些智能任务的处理。什么智能任务呢?比如说知识的表达,把看到的、感觉到的东西表达出来,还有推理、学习等比较高级的认知功能。(我之所以要将“智能”限定在这些任务上面,是因为如果不限定,我认为整个计算都可以称之为智能。)我尝试抽象提取,看看这些智能任务的共同点,发现它们似乎都跟环境有关,对进化非常重要,对人、对生命体的生存和繁荣息息相关。
5分钟弄懂量子信息处理基本概念:存储、操作和读取
我做量子信息科学已经做了将近二十年,这个领域正在指数级地增长。量子信息科学其实并不可怕,下面我跟大家分享一些基本的量子信息的知识。抽象地讲,什么叫量子信息处理?量子信息处理就是严格基于量子力学的信息处理。我之所以说“严格”,是因为哪怕是经典的计算,最终也依然使用量子力学的存储和器件,寒武纪、比特大陆设计的芯片到最底层也都是量子的,虽然在逻辑那一层是遵循经典的信息处理。经典物理是量子力学在宏观层次的一个近似。所以,首先量子信息处理是严格基于量子力学的
其次,量子信息处理目前还没有办法被经典的信息处理很快地模拟,这是一个未解决的问题——也许明天早上我起床后发现有一个人发明了迅速模拟量子计算的经典算法,那我马上改行做AI,这是有可能的。但是,我倾向于认为,而大部分科学家都不会认为量子计算能够被经典计算迅速地模拟。因为我们需要量子力学,有些现象无法用经典物理解释。
我之所以说量子计算有可能更有力量,是因为我们不知道如何模拟量子计算。什么是量子计算?先从经典的存储讲起,一个比特(bit)有两个状态,0状态和1状态,我在这里把它表示成一个二维向量空间中两个正交的单位长度向量。如果是一个随机的比特,就是说某一定概率是0,某一定概率是1,在数学上我们可以把一个随机比特的状态表示成一个向量,这个向量有两个维度,处于向量0和向量1之间的线段上。比如完美随机的比特对应(1/2, ½)这个点。这是我们知道经典的存储,一个比特。
那量子比特(qubit)呢?量子比特也是0和1的组合,这个组合是长度为1的向量,在二维空间里,长度为1的向量就是一个圆。把复数的情况省略掉,假设系数都是实数,一个量子态就是一个圆上的一点,所以经典存储跟量子存储的区别就在于线跟圆的区别,经典存储是线上的点,量子是圆上的点,类似拳跟太极的区别。
如果我们有很多比特,假如有2个、3个、4个呢?我们知道,如果有2个比特,一共有4种可能。如果有 n 个比特,就有2的 n 次方个可能。在数学上,我们可以把这2的N次方个可能的经典状态,对应到2的N次方维的向量空间上的一组正交基,经典的随机比特的表示就是个平面上的点,是2的个N次方基本状态之间的”凸“组合。而每个量子态是这个球面上的一点,它也是个长度为1的线性组合。系数可以是负的。负的数很重要,因为正+负是可以消亡的。
有了存储后,我们需要对它进行操作。如果我们要求量子的状态是一个长度为1的向量,那么操作之后它肯定也是个长度为1的向量。所以我们要问,什么样的操作是最简单的、能够保持长度的操作呢?答案就是在实数空间上做正交变化。首先,我们希望这个操作是线性变换,保持长度,在实数上就是正交变换,如果是在复数空间,就是酉变化。举个例子,进行旋转不改变长度就是线性变换,所以旋转是一个量子操作。
量子计算里面有个特别点,在如何读取数据上。量子存储跟经典的不同,因为人只能明白经典的信息,所以我们需要从量子状态里面读取经典的信息。读取时对应的数学操作是投影。在线性空间里,每一个向量可以分解成正交的子向量的和,每一个子向量对应一个经典的信息,这个维度是111,这个维度是000,那个可能是011。那么,N个量子比特,它的状态是个长度为1的向量,这个向量可以分解成几个子向量的和,每个子向量都沿着经典的信息方向,测量时你会随机观察到这些经典结果之中的一个,其概率就是这个经典结果对应的投影的长度平方。
现在你明白为什么我们要求量子态是个长度为1的向量了,因为所有概率加起来等于这些分向量长度平方加起来,也就是原来向量的长度,也就是1。
好,讲过了存储是向量,操作是保持长度的线性变换,读取就是投影。那量子计算是什么呢?就是一开始我们有经典的输入,比如0100…,这里每条线对应一个量子比特,每个长方形对应一个操作,也就是一个保持长度的线性变换。所谓的量子电路就是从经典的输入开始,每个输入的比特会对应到一个量子比特。我们可以选择在哪里进行基本的量子操作,最后对这些量子比特测量就可以得到结果.好的算法应该以很高的概率产生我们想要的结果。
量子计算为什么比经典的更快?有很多路径,并且错误概率可以被抵消
我现在做一个高层次的解释:为什么量子计算可能比经典计算快?下面我们来看确定性计算、随机计算和量子计算。确定性的计算很简单,从现在的状态开始, 再往下只有一个选择,所有的未来都是确定的。而随机计算你可以抛硬币,走不同的路径,50%概率可以走左边,50%的概率走右边,算法可以抛很多次硬币,走的路径也可以有很多很多。如果抛100次硬币,可能有2的100次方那么多的不同的计算路径。人们常说,量子计算的能力在于有大量不一样的路径,我觉得这样说太过简单,因为随机算法也可以有很多的路径。所以,有很多计算路径本身并不是量子计算更快的根本原因。
在经典的随机计算里,某个地方犯了错误以后,我们不能把那个错误的概率抹掉。比如图里这些红点是错误的结果,每个红点对应一个很小的概率,总的错误的概率就是这些所有错误节点的概率之和。这是经典的随机算法的情况。
量子算法跟随机算法相同的一点是路径有很多分差,是指数级的不同的分差。但是,量子态每个分叉的权重可以是正的也可以是负,量子操作也会有负数的权重。最后的节点,有些答案正确,有些答案错误,每个节点都会有一个权重,而这个权重可以是正的也可以是负的。负的跟正的在一起可能就会抵消。
请看上面这张图。回到经典的情况(注:上图左边的树),绿的是正确答案,这里每个向量的长度对应得到正确答案的概率,那么这些正确答案的概率会叠加起来,另一方面,错误答案的概率也叠加起来,所以最后正确的就是这么多,错误的也很多。
而这里是量子计算的情况(注:上图右边的树),每个向量对应一个最后的一个基本状态,向量的长度对应它的权重。这些绿的子向量都对应于正确的最终状态,红的是对应错误的最终状态。红的子向量跟绿的子向量不同:绿的都指向大约同一个方向,而红的则指向各种方向,结果把绿色的加在一起,信号就互相加强,变得很长,但把红的加在一起就会互相抵消。可以想象,量子计算也像随机算法一样有很多路径,但是错误的路径因为有负的权重,所以相互抵消,而正确的路径互相叠加,形成了很大的信号。
人类智能是经典的,神经元工作的基本原理是电,经典计算能够模拟人类神经元工作
我们今天在这里并不是为了给大家上量子计算的课, 我很久没有教书,还有些想念教书的时候。今天讨论的是两个问题,第一,我们人类智能到底是不是量子的?潘院士最近说,不要老是把量子跟哲学宗教结合在一起,我们今天做一个科学的讨论。到底有没有证据说明人的智能是量子的? 我们先看,人类智能的硬件和软件都分别是什么。人的智能的中心硬件是大脑,大脑由神经元组成,神经元是个细胞,细胞里有DNA, 蛋白质和其他分子,最后都是原子跟基本的粒子组成。从生物角度看,大脑的功能应该是在化学反应这个层次,没有必要再往下走了。
除了这个中心处理器,人类还有感官系统,视觉、触觉、味觉,对鸟类来讲,还有另外一个感官,鸟类能够感受磁场,这对鸟类很重要。实际上,人类的眼睛里也有一个分子是对磁场敏感的,但是我们没有感觉到,至少我们的大脑没有感觉到。
软件呢我们有很多东西都不太明白。人类智能软件和硬件的区分也可以讨论。而我个人把神经元之间的连接归为软件。不过,我们现在还没有彻底弄清人类神经元之间整体是怎么连接的。小的系统如线虫的神经元怎么连接我们知道了,老鼠的还不清楚,果蝇的正在做。更高级的功能,比如记忆、推理、决策,都还是很不清楚。
好,那么量子对哪些生命的过程是重要的?——将能量转化为化学能的生物学过程实质上是量子过程,因此到了分子的层次,肯定都是量子的,这就不用讲了——有三个领域人们比较确定,这三个领域也是所谓的“量子生物学”的主要部分。我借用一张网上找到的图,量子生物学好像主要有三个内容,一个是光合作用。我们知道光合作用对生命十分重要,而且我们现在知道量子效应对光合作用 很重要。我们知道,在非常深的海底有一种细菌,它每秒钟要吸收3个光子,每秒3个单光子,其中的机理人们还在研究。我们的眼睛也能够检测到非常少数的光子,所以人类的眼睛里也许就有单光子检测器。
另一个领域是刚才提到的鸟类如何感觉磁场。还有一个是嗅觉,这也是科学家比较确定量子起关键作用的领域。回到智能的问题,这些活动似乎智能的关系并不大。对人类智能来讲,最关键的是在神经元那个层级,我认为没有证据有用到 量子效应。这是为什么呢?我们对神经元的工作原理还是比较清楚的,神经元细胞基本上是电子的元件,这种细胞有两种突出的东西,一个叫树突,有很多分叉,另一个叫轴突,这只有一个。树突负责收集信号,轴突负责发射信号。树突收集的信号叫神经递质,神经递质是一种分子,当它足够多的时候,会引发电压的变化。作为一个细胞,神经元内部跟外部有一个电压差,所以电压差的改变是神经元工作最基本的原理,而我认为这个过程在逻辑层面并不是量子的。
机器智能必将超越人类智能,量子智能定会出现,而且一定是AI
所以我个人认为,人类的智能是经典的。我们看神经元的工作,很简单,基于电信号,我相信用经典的计算模拟就能够实现神经元的计算。所以,一个应用如果想达到人类的智能,我们只需要经典的计算技术也许就够了。
第二个观点,最终机器智能肯定要超越人类智能。如果你同意我刚才的结论,人类智能是经典的,那么你应该同意,做经典计算人脑是拼不过机器的,故而机器智能最终肯定会超越人类智能。
再一个观点,量子智能肯定是AI。如果你同意人类智能是经典的,那么量子智能应该是AI的。当然,AI不会全是量子的。
那么,会不会有量子智能?有的话,量子智能会超出经典智能多少?我先圈定一下,所谓的“量子智能”指的是用量子信息处理来解决智能的任务。要回答前面的问题,首先要看为什么会有智能,我认为这是进化的结果。人类之所以有智能,是因为我们在这里,我们为了生存,为了发展,我们就进化出了智能。那么,我想论证量子智能肯定会出现,肯定会存在,基本的原因是hard intelligence(硬智能)很难。比如说理解、推理、创造力等。这些高级的智能作为计算任务非常难。
我现在有几个假设:
第一个假设是,如果你能够把这些高级智能做得很好,你就会得到商业的利益。这是我的一个假设,我们可以另外讨论这假设成立与否,但是这里我要做出这个假设。
第二个假设是,硬智能是在太难算了,不存在很快的解决方案。我们能够证明一些问题,比如说为一个双人游戏找到制胜战略,这件事本身是已经被证明是很难的。所以,只要量子信息处理有一定的潜能去超过经典的信息处理,我们就总有动力去做量子智能(来提升对这些难题的解决)。
那么量子智能会是什么样的?我们要先看看现在已经发现的量子信息处理在哪些任务上能够比经典做得更好。一个是搜索问题,我们现在得出结论,如果一个经典的算法用T步,量子算法就可以用根号 T。如果已有一个随机算法,在一定条件下就会有相应的量子加速。
所以量子智能的形态有可能是这样的,一种是经典的机器智能再加上通用的量子加速的办法,相当于大的框架是一个量子算法,但是底下有经典的机器智能。另外一种则正好相反,大的框架是经典的,但其中有些步骤是量子的,或者完全是量子的,如果有硬件的话我们可以尝试一下,也许量子真的做的快。
原文发布时间为:2017-12-3
本文作者:AI WORLD 2017
原文链接:阿里云量子技术首席科学家施尧耘:机器智能必将超越人类智能,量子智能一定是AI