MDCC 2013移动开发者大会于2013年11月13-14日在北京国家会议中心隆重召开,本届大会由CSDN和创新工场联合主办。逾百位国内外移动互联网领域的领军人物与核心技术专家,以“全民移动,重塑世界”为主题,分享最新实践经验,探讨移动互联网发展趋势。此外,智能硬件、移动娱乐游戏、微APP三大主题峰会成为本次大会新亮点。
中国工程院院士李德毅发表了题为《大数据时代的认知计算》的演讲。他分析了认知究竟可不可以计算,并阐述了大数据时代、移动时代,认知计算应该何去何从。他认为以人为本的认知物联网的时代已经到来了,大数据时代的认知计算正在逼近认知科学。
以下为演讲实录:
李德毅:各位同行大家好。移动生活、移动品质,给我们带来的变化很大。这一年社会上的人,拿个 手机 ,有说有笑有拍照,这就是给我们带来的变化。
人活着就要动,移动的速度是多少,把移动速度搞清楚,移动产品才搞得清楚。我们靠两条腿动,靠轮子动,靠高铁动,靠飞机动,主要还是低速移动,所以我们叫移动,不叫运动。但是背个笔记本是个负担,所以我就想一想,大数据时代对我们移动生活带来了什么变化,也就是大数据时代人的认知,认知最简单的是说话、听、看、写。
认知可不可以计算?
这是一个很古老的命题。因为老科学家认为人是世界上最高级的精品,比 其他 东西都强,认知是不可计算的。
我们希望提高人的生活品质,我们希望智慧。说把智慧城市变成智能城市,智能是个技术,我们要的是智慧。我们说你这个良心大大的坏了或者我心情不好学不进去,说明这个认知和心态有关系。但是作为人工智能的科学,作为认知科学来说,我们长期以来强调的是智商,脑智,依据现有知识进行分析、联想、推导或归纳,产生新知。我们认为人的认知主要靠大脑。
后来说不对,你这个人智商很高,情商太低不行。面试的时候老板要通过意象、直觉、想象、情感等进行直观、综合的思考,在创新中起着至关重要的作用。这就是二元。更多的人说成功等于40%的智商和60%情商的相互作用。所以认知科学到现在还有很多没有解读的地方。
1936年,天才科学家图灵建立了图灵机概念,任何形式系统可以通过图灵机准确刻画。
老百姓通常把计算工作交给电脑,它是基于人脑的智能吗?IBM研究了一个生产计算机。人们把人的思维能力放到机器里去,前台是机器,后台是人。从这个意义上,认知应该是可以计算的。
我们的程序问题、停机问题、程序验证问题本质上是不可以计算的。所以我们打了补丁还有漏洞。
数学自身是机器程序不可穷尽的。并不是所有的数学问题都可以用计算机来做的。所以人脑不能被物化变成电脑,重要是人脑能不能被形式化。好多诺贝尔获得者都在这个方面获得了重大贡献。但计算性是不依赖于形式系统的选择的。
因此,IT工作者千万不能用行政化的方法来研究思维和意识。意识怎么理解?灵魂怎么理解?宗教怎么理解?信仰怎么理解?它们和思维是什么关系?脑里面有分工,这块干什么,那块干什么,后来研究的成果发现,人的意识和精神活动,是由大脑不同区域共同作用产生的。怎么样才能共同作用,这个问号到现在还很大。
生命科学家喜欢物理,喜欢化学,难道人的思维是由物质和化学规律支配的吗?这个令人怀疑。
有人认为,人是不可能自己把自己搞清楚的。你要研究一个东西,要站在一个东西之外。
大数据时代的挑战
在这样的情况之下,自然杂志登出了一篇重要文章,里面一个小标题——BD(大数据)时代的科学,我们应该怎么做,这是我们时代的挑战。
大数据的来源分为三大块:
第一块是地球,我们叫数字地球,自然大数据把我们的地球、宇宙搞清楚。 第二是生命,包括各种动物,尤其包括我们人类,这本身也是大数据。 第三就是社交,互联网,尤其是移动互联网,我们的日常生活都是大数据,这样的大数据使你对科学,认知科学提供了挑战。
我们去看病,现在不是看医生,医生很宝贵,主要是看仪表。到了医院还没坐三分钟,医生一大堆化验单出来,让做X光、B超、内镜检查、核磁,你还得排队,排了两个星期,才把这些检查做了。你拿着化验结果去找医生,医生不到三分钟把药开出来,现在看病不是看医生,现在就是查,诊查的治疗。医生跟你说一句话,你还没听懂就接待下一个病人,这就是我们日常看病,花钱看仪器,这就是大数据带来的现实。
这些年来,医学诺贝尔奖很多颁给了医学企业的发明,所以现在的高明医生,要么是器械的发明,要么他们能从医疗数据发现价值。你排队5分钟,医生一看没问题,他从这个数据里发现了价值。大数据时代你会发现,你只要知道了是什么,就知道怎么做。
这样问题就淡化了,为什么不仔细诊断了,因为这么多病案,你这个情况在他的病人库里非常清楚,所以怎么做很简单。
我们认为科学是解决的形而上,技术解决的是形而下,我们研究的对象是认知、智慧。现在把我们的对象是什么的问题,可以用大数据来解决,在这样的情况下,对大数据对不同案例对象的处理,也可以用大数据来解决。因此这个社会更多研究的是关联,把科学放在后面。科学解决因果问题,要解决主次问题,解决前后问题。所以人们能更多的解决问题就是好汉。
我们对曾经认为的科学是技术的先导产生了怀疑。在当今情况下,因为IT技术的发展,技术也可以成为科学的先导,要求认知自学的数字化,这是我们大数据对认知科学的认识,以及认知计算的不同。认知计算是技术。
这样的情况下,大数据时代对计算正在告别认知科学。
对人的认知而言,欧盟在上世纪就进行了脑科学的研究。今年澳门又提出了人类大脑计划的,奥巴马也发动了脑计划。这和我们信息工作者关联得太少,全是生命科学家,我觉得我们人类的大脑,从生命科学的角度来讲,大家和猴子的大脑区别不是太大,因为已经有研究表明,脑结构差不多。
我就在想,我是在英国学习的,撒切尔后来得了老年痴呆症,我个人认为她的老年痴呆和一般人的老年痴呆没有多大的区别。因为我认为脑计划的研究有一点偏了。
人类和其他动物相比,都有灵感,有语言,唯独人有文字,因为有文字,才有文明,才有传承。我们的青年人到大学,都要学习知识,学习文明,这个很重要。如果没有文字,我们和其他动物差不多。
另外还要研究人类认知的社会属性,这两个不清楚,认知科学搞不清楚,我建议要把这两点作为人类认知的切入点。
要研究脑认知的后天属性,认知不仅是前面的天性所决定的,DNA、基因、遗传,还要看后天学习和积累的结果,是与社会环境、社会实践,群体交互相关联的。
在移动生活时代,我们怎么办呢?
大数据时代自然语言处理技术正在改变我们的移动生活。
语言是思想的直接现实,这句话是马克思讲的,语言是人类思维的载体,语言是认知科学和认知计算要应对的首要问题。我们的移动生活首先要讲语言,你哪一天不说话不行,能听会说是我们必须具备的能力。让我们迎接语音时代的到来。人类走向文明的四个重大里程碑中,语言和文字占了重要的地位。
人类运用自然语言进行交流获得的效果。你跟人家沟通得到的效果当中,很重要的就是你的强度和语调,要占38%,还有你的面部表情,它有情感在里面。从我们认知科学来说,半个世纪的自然语言理解的研究中,我们对此关注了多少?
人们在思考和解决任何问题时,通常是定性的,对量的规定性往往是是非数值。我们研究大数据,它有一个定性,定量转换的问题。科学研究当中,人们用对象语言表达一个特定的精确学科,比如物理数学、C语言,都是用自然语言来表达。
我们就变成两个学派的争论,脑科学认为自然语言是不可计算的。
如果一个问题不能全部形式化,那么其中的局部问题可不可以形式化?自然语言可以在什么程度上被形式化,取决于能否把不确定性形式化。研究不确定性,我认为是一条道路。
科大讯飞做了一个客服中心,移动客服录音大数据,可实现一秒钟对100万小时音频数据的检查。这就是一个很大的变化。你是雇佣500位客服人员还是启用一台 服务器 ?所以还是用一台服务器。在半个世纪的自然语言理解的研究中,我们对此关注了多少?
我们看报纸,有这么一段文章,但是你仔细看的时候,发现这个字序不对,但是它又能影响我们多少东西?在半个世纪的自然语言理解的研究中,我们对此关注了多少?
再看一个例子,我们网上动不动要区分对方是人,我们经常出来一个识别码,叫你再输入一遍识别码,证明你是人。在半个世纪的语言文本理解的研究中,我们对此又研究了多少?
我觉得要创新,要新思维才能解决。机器人能听会说,能看会想,正在改变我们的生活,这就是移动生活的产品。
有一个产品你们可以做做,叫在线服务机器人。将来IT行业里面,随着智能技术的发展,移动客服中心可以裁减到50人。我们能不能有个智能 耳机 ,这是我个人想的,你戴着耳机,我说话,我的口音比较重,你的耳机听到的是普通话,你能不能做这个?这个很好,特别是广东话北方人听不懂,尤其是语言翻译。假如两国元首会谈,奥巴马的话是普通话,但是是奥巴马的语音。这是一个多大的改变。实际上现在已经有了,这时候就需要云计算,需要一个方案服务中心,需要一个中文翻译服务中心,位置服务中心等等。
语音到文字,文字到文字,我们要让数据说话,这就是大数据给我们移动生活带来的变化。所以有人说先干掉短信。
我这个年龄对五笔字型输入是情有独钟,我们有两代人都是用五笔字型输入。从搜索引擎到个性化搜索,从规则学习到统计学习,从智能计算到情感计算,从形式语言学到智能翻译。
我们想象将来电视台主持人他拿到就能念,这个虚拟主持人在形象、情感、动作、语音、语调、风格都像某一个人多好,那我们演员也可以失业了。这样的时代也许会到来。
以大数据形态反映的语言,是可交互和理解的、是带毛的、鲜活的、有情感的原生态语言。
智能驾驶
下面讲讲和我们移动生活相关的智能驾驶,智能驾驶为什么火起来呢?因为它跟云计算,移动互联网,大数据密切相关,你只要做了这个东西,政府肯定会支持你。因为是战略性新兴产业。当初自然科学基金会在确定这个项目的时候,提出了科学的任务,解决实际的计算问题。后来把这个科学问题明确地用一个载体来表现,叫做科学任务,在正常的情况下北京开到天津,你能不能做得到?
我们用了很多雷达,我们要有驾驶行为数,在这个过程当中我们遇到了很多的困难,好比说要不要研制一个三维成像,怎么样有自学习功能。我们取得了可喜的成果。
我们有详细的实验报告、实验环境,以及超车的次数,我们今年还和韩国车做了比赛,我们在车子里做了一个交互鉴定。
我们想想以后怎么打的?手机目前来讲是人用的,所以以后是人和机器交互,将来你用手机打的,你把手机往 汽车 来一插,汽车就开跑了,到了一个地方,钱一付你就可以走了,你改变路径,你就用手机跟机器人对话,我们在座的企业家能不能做成,人、手机和轮式机器人之间的关系。如果这个做得了就不得了。
我现在的想法是想做这两个事情,北京从天安门到首都机场做一个实验,混在正常路径当中,目前我们有5辆车。上海我们希望从虹桥机场到浦东再到人民商场,我们准备了6辆车。一种是电动车,一种是混合动力车,一种是国产车。一个类型两辆。如果有一天北京城出现了飙车机器人,当然这是违法的,你还要问认知可以计算吗?
大数据时代,技术的有效性要比科学的完整性更重要。所以我建议这张图(见下面的PPT),给一些中小企业一些参考,我认为以人为本的认知物联网的时代已经到来了。有一个 智能眼镜 解决照相问题,解决看的问题,有一个智能耳机解决听的问题,有一个智能笔解决写的问题,还有智能手表,解决你身体测试,以及通讯的需求等等。这样一来,以人为本,构成穿戴式设备,这样就可以干成很多事情了。这样真正可以提高我们移动生活的品质,实现智慧生活。
总结一下,如果说人类对认知问题不能全部完整统一的形式化,这是认知科学要做的事。我们认知计算可以让成千上万的小众,甚至千千万万的特定情况下的认知可以局部的形式化。那么,大数据时代的认知计算是否正在逼近认知科学呢?