中国工程院院士李德毅:大数据时代的认知计算

摘要: MDCC 2013移动开发者大会于2013年11月13-14日在北京国家会议中心隆重召开,本届大会由CSDN和创新工场联合主办。逾百位国内外移动互联网领域的领军人物与核心技术专家,以全民移动,重

  MDCC 2013移动开发者大会于2013年11月13-14日在北京国家会议中心隆重召开,本届大会由CSDN和创新工场联合主办。逾百位国内外移动互联网领域的领军人物与核心技术专家,以“全民移动,重塑世界”为主题,分享最新实践经验,探讨移动互联网发展趋势。此外,智能硬件、移动娱乐游戏、微APP三大主题峰会成为本次大会新亮点。

  中国工程院院士李德毅发表了题为《大数据时代的认知计算》的演讲。他分析了认知究竟可不可以计算,并阐述了大数据时代、移动时代,认知计算应该何去何从。他认为以人为本的认知物联网的时代已经到来了,大数据时代的认知计算正在逼近认知科学。

  

  

  以下为演讲实录:

  李德毅:各位同行大家好。移动生活、移动品质,给我们带来的变化很大。这一年社会上的人,拿个 手机 ,有说有笑有拍照,这就是给我们带来的变化。

  人活着就要动,移动的速度是多少,把移动速度搞清楚,移动产品才搞得清楚。我们靠两条腿动,靠轮子动,靠高铁动,靠飞机动,主要还是低速移动,所以我们叫移动,不叫运动。但是背个笔记本是个负担,所以我就想一想,大数据时代对我们移动生活带来了什么变化,也就是大数据时代人的认知,认知最简单的是说话、听、看、写。

  认知可不可以计算?

  

  这是一个很古老的命题。因为老科学家认为人是世界上最高级的精品,比 其他 东西都强,认知是不可计算的。

  我们希望提高人的生活品质,我们希望智慧。说把智慧城市变成智能城市,智能是个技术,我们要的是智慧。我们说你这个良心大大的坏了或者我心情不好学不进去,说明这个认知和心态有关系。但是作为人工智能的科学,作为认知科学来说,我们长期以来强调的是智商,脑智,依据现有知识进行分析、联想、推导或归纳,产生新知。我们认为人的认知主要靠大脑。

  后来说不对,你这个人智商很高,情商太低不行。面试的时候老板要通过意象、直觉、想象、情感等进行直观、综合的思考,在创新中起着至关重要的作用。这就是二元。更多的人说成功等于40%的智商和60%情商的相互作用。所以认知科学到现在还有很多没有解读的地方。

  1936年,天才科学家图灵建立了图灵机概念,任何形式系统可以通过图灵机准确刻画。

  老百姓通常把计算工作交给电脑,它是基于人脑的智能吗?IBM研究了一个生产计算机。人们把人的思维能力放到机器里去,前台是机器,后台是人。从这个意义上,认知应该是可以计算的。

  我们的程序问题、停机问题、程序验证问题本质上是不可以计算的。所以我们打了补丁还有漏洞。

  数学自身是机器程序不可穷尽的。并不是所有的数学问题都可以用计算机来做的。所以人脑不能被物化变成电脑,重要是人脑能不能被形式化。好多诺贝尔获得者都在这个方面获得了重大贡献。但计算性是不依赖于形式系统的选择的。

  因此,IT工作者千万不能用行政化的方法来研究思维和意识。意识怎么理解?灵魂怎么理解?宗教怎么理解?信仰怎么理解?它们和思维是什么关系?脑里面有分工,这块干什么,那块干什么,后来研究的成果发现,人的意识和精神活动,是由大脑不同区域共同作用产生的。怎么样才能共同作用,这个问号到现在还很大。

  生命科学家喜欢物理,喜欢化学,难道人的思维是由物质和化学规律支配的吗?这个令人怀疑。

  有人认为,人是不可能自己把自己搞清楚的。你要研究一个东西,要站在一个东西之外。

  大数据时代的挑战

  在这样的情况之下,自然杂志登出了一篇重要文章,里面一个小标题——BD(大数据)时代的科学,我们应该怎么做,这是我们时代的挑战。

  大数据的来源分为三大块:

  

第一块是地球,我们叫数字地球,自然大数据把我们的地球、宇宙搞清楚。 第二是生命,包括各种动物,尤其包括我们人类,这本身也是大数据。 第三就是社交,互联网,尤其是移动互联网,我们的日常生活都是大数据,这样的大数据使你对科学,认知科学提供了挑战。

  

  我们去看病,现在不是看医生,医生很宝贵,主要是看仪表。到了医院还没坐三分钟,医生一大堆化验单出来,让做X光、B超、内镜检查、核磁,你还得排队,排了两个星期,才把这些检查做了。你拿着化验结果去找医生,医生不到三分钟把药开出来,现在看病不是看医生,现在就是查,诊查的治疗。医生跟你说一句话,你还没听懂就接待下一个病人,这就是我们日常看病,花钱看仪器,这就是大数据带来的现实。

  这些年来,医学诺贝尔奖很多颁给了医学企业的发明,所以现在的高明医生,要么是器械的发明,要么他们能从医疗数据发现价值。你排队5分钟,医生一看没问题,他从这个数据里发现了价值。大数据时代你会发现,你只要知道了是什么,就知道怎么做。

  这样问题就淡化了,为什么不仔细诊断了,因为这么多病案,你这个情况在他的病人库里非常清楚,所以怎么做很简单。

  我们认为科学是解决的形而上,技术解决的是形而下,我们研究的对象是认知、智慧。现在把我们的对象是什么的问题,可以用大数据来解决,在这样的情况下,对大数据对不同案例对象的处理,也可以用大数据来解决。因此这个社会更多研究的是关联,把科学放在后面。科学解决因果问题,要解决主次问题,解决前后问题。所以人们能更多的解决问题就是好汉。

  我们对曾经认为的科学是技术的先导产生了怀疑。在当今情况下,因为IT技术的发展,技术也可以成为科学的先导,要求认知自学的数字化,这是我们大数据对认知科学的认识,以及认知计算的不同。认知计算是技术。

  这样的情况下,大数据时代对计算正在告别认知科学。

  对人的认知而言,欧盟在上世纪就进行了脑科学的研究。今年澳门又提出了人类大脑计划的,奥巴马也发动了脑计划。这和我们信息工作者关联得太少,全是生命科学家,我觉得我们人类的大脑,从生命科学的角度来讲,大家和猴子的大脑区别不是太大,因为已经有研究表明,脑结构差不多。

  我就在想,我是在英国学习的,撒切尔后来得了老年痴呆症,我个人认为她的老年痴呆和一般人的老年痴呆没有多大的区别。因为我认为脑计划的研究有一点偏了。

  人类和其他动物相比,都有灵感,有语言,唯独人有文字,因为有文字,才有文明,才有传承。我们的青年人到大学,都要学习知识,学习文明,这个很重要。如果没有文字,我们和其他动物差不多。

  另外还要研究人类认知的社会属性,这两个不清楚,认知科学搞不清楚,我建议要把这两点作为人类认知的切入点。

  要研究脑认知的后天属性,认知不仅是前面的天性所决定的,DNA、基因、遗传,还要看后天学习和积累的结果,是与社会环境、社会实践,群体交互相关联的。

  在移动生活时代,我们怎么办呢?

  大数据时代自然语言处理技术正在改变我们的移动生活。

  语言是思想的直接现实,这句话是马克思讲的,语言是人类思维的载体,语言是认知科学和认知计算要应对的首要问题。我们的移动生活首先要讲语言,你哪一天不说话不行,能听会说是我们必须具备的能力。让我们迎接语音时代的到来。人类走向文明的四个重大里程碑中,语言和文字占了重要的地位。

  人类运用自然语言进行交流获得的效果。你跟人家沟通得到的效果当中,很重要的就是你的强度和语调,要占38%,还有你的面部表情,它有情感在里面。从我们认知科学来说,半个世纪的自然语言理解的研究中,我们对此关注了多少?

  人们在思考和解决任何问题时,通常是定性的,对量的规定性往往是是非数值。我们研究大数据,它有一个定性,定量转换的问题。科学研究当中,人们用对象语言表达一个特定的精确学科,比如物理数学、C语言,都是用自然语言来表达。

  我们就变成两个学派的争论,脑科学认为自然语言是不可计算的。

  如果一个问题不能全部形式化,那么其中的局部问题可不可以形式化?自然语言可以在什么程度上被形式化,取决于能否把不确定性形式化。研究不确定性,我认为是一条道路。

  科大讯飞做了一个客服中心,移动客服录音大数据,可实现一秒钟对100万小时音频数据的检查。这就是一个很大的变化。你是雇佣500位客服人员还是启用一台 服务器 ?所以还是用一台服务器。在半个世纪的自然语言理解的研究中,我们对此关注了多少?

  我们看报纸,有这么一段文章,但是你仔细看的时候,发现这个字序不对,但是它又能影响我们多少东西?在半个世纪的自然语言理解的研究中,我们对此关注了多少?

  再看一个例子,我们网上动不动要区分对方是人,我们经常出来一个识别码,叫你再输入一遍识别码,证明你是人。在半个世纪的语言文本理解的研究中,我们对此又研究了多少?

  我觉得要创新,要新思维才能解决。机器人能听会说,能看会想,正在改变我们的生活,这就是移动生活的产品。

  有一个产品你们可以做做,叫在线服务机器人。将来IT行业里面,随着智能技术的发展,移动客服中心可以裁减到50人。我们能不能有个智能 耳机 ,这是我个人想的,你戴着耳机,我说话,我的口音比较重,你的耳机听到的是普通话,你能不能做这个?这个很好,特别是广东话北方人听不懂,尤其是语言翻译。假如两国元首会谈,奥巴马的话是普通话,但是是奥巴马的语音。这是一个多大的改变。实际上现在已经有了,这时候就需要云计算,需要一个方案服务中心,需要一个中文翻译服务中心,位置服务中心等等。

  语音到文字,文字到文字,我们要让数据说话,这就是大数据给我们移动生活带来的变化。所以有人说先干掉短信。

  我这个年龄对五笔字型输入是情有独钟,我们有两代人都是用五笔字型输入。从搜索引擎到个性化搜索,从规则学习到统计学习,从智能计算到情感计算,从形式语言学到智能翻译。

  我们想象将来电视台主持人他拿到就能念,这个虚拟主持人在形象、情感、动作、语音、语调、风格都像某一个人多好,那我们演员也可以失业了。这样的时代也许会到来。

  以大数据形态反映的语言,是可交互和理解的、是带毛的、鲜活的、有情感的原生态语言。

  智能驾驶

  下面讲讲和我们移动生活相关的智能驾驶,智能驾驶为什么火起来呢?因为它跟云计算,移动互联网,大数据密切相关,你只要做了这个东西,政府肯定会支持你。因为是战略性新兴产业。当初自然科学基金会在确定这个项目的时候,提出了科学的任务,解决实际的计算问题。后来把这个科学问题明确地用一个载体来表现,叫做科学任务,在正常的情况下北京开到天津,你能不能做得到?

  我们用了很多雷达,我们要有驾驶行为数,在这个过程当中我们遇到了很多的困难,好比说要不要研制一个三维成像,怎么样有自学习功能。我们取得了可喜的成果。

  我们有详细的实验报告、实验环境,以及超车的次数,我们今年还和韩国车做了比赛,我们在车子里做了一个交互鉴定。

  我们想想以后怎么打的?手机目前来讲是人用的,所以以后是人和机器交互,将来你用手机打的,你把手机往 汽车 来一插,汽车就开跑了,到了一个地方,钱一付你就可以走了,你改变路径,你就用手机跟机器人对话,我们在座的企业家能不能做成,人、手机和轮式机器人之间的关系。如果这个做得了就不得了。

  我现在的想法是想做这两个事情,北京从天安门到首都机场做一个实验,混在正常路径当中,目前我们有5辆车。上海我们希望从虹桥机场到浦东再到人民商场,我们准备了6辆车。一种是电动车,一种是混合动力车,一种是国产车。一个类型两辆。如果有一天北京城出现了飙车机器人,当然这是违法的,你还要问认知可以计算吗?

  大数据时代,技术的有效性要比科学的完整性更重要。所以我建议这张图(见下面的PPT),给一些中小企业一些参考,我认为以人为本的认知物联网的时代已经到来了。有一个 智能眼镜 解决照相问题,解决看的问题,有一个智能耳机解决听的问题,有一个智能笔解决写的问题,还有智能手表,解决你身体测试,以及通讯的需求等等。这样一来,以人为本,构成穿戴式设备,这样就可以干成很多事情了。这样真正可以提高我们移动生活的品质,实现智慧生活。

  总结一下,如果说人类对认知问题不能全部完整统一的形式化,这是认知科学要做的事。我们认知计算可以让成千上万的小众,甚至千千万万的特定情况下的认知可以局部的形式化。那么,大数据时代的认知计算是否正在逼近认知科学呢?

时间: 2025-01-14 01:20:40

中国工程院院士李德毅:大数据时代的认知计算的相关文章

中国工程院院士李德毅畅想云计算时代

中国工程院院士李德毅 "20年内电脑将淡出百姓日常生活" 什么是云计算?李德毅做了一个形象的比喻---钱庄.最早人们把钱放在枕头底下,后来有了钱庄,很安全,不过兑现起来比较麻烦,现在的银行可以到任何一个网点(或者ATM)取钱,甚至到国外也没问题.用一句时髦的话,大家可以管这种银行提供现金的方式叫"云现金". "20年内,电脑就会渐渐远离老百姓的日常生活.人们只需携带类似手机的端设备,就可实现目前电脑所具备的功能."李德毅说,云计算有很好的商业模式

CCAI 2017 | 中国工程院院士李德毅:L3的挑战与量产

在本次大会上,中国工程院院士.中国人工智能学会理事长李德毅为所有参会者带来了主题为<L3 的挑战与量产>的报告.从"L3 难在哪里?"."如何突破 L2 的天花板?"."量产 L3 的策略"三个方面出发,重点讨论了当前 L3 自动驾驶汽车所面临的挑战以及量产问题,精彩绝伦的演讲在现场引起了强烈的共鸣以及多次热烈的掌声. 中国工程院院士.中国人工智能学会理事长李德毅 在此次演讲中,李德毅院士谈到了L3级别自动驾驶的难点,以及从L2向L3

中国工程院院士李德毅:智能车产业化实践与展望

雷锋网(公众号:雷锋网)按:原文发布于机器人圈公众号,在未改变原意的基础上略有删减.李德毅,中国工程院院士.欧亚科学院院士,指挥自动化和人工智能专家.1983年获英国爱丁堡海里奥特·瓦特大学博士学位.总参第61研究所研究员.中国指挥和控制学会名誉理事长.中国人工智能学会理事长. 李德毅,人工智能领域响当当的泰斗.作为自动化和人工智能专家,李院士对智能车产业的生态环境.工程化实践与未来发展有自己别具一格的看法,他反复提及智能车和轮式机器人的自主知识产权与国产化.就像李院士自己说的: 虽然个人力量有

中国工程院院士李德毅受聘云基地顾问

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; "云计算的生命力在于细分市场需求,从一个一个业务领域的服务切入."2月16日下午,中国工程院院士.云计算专家委员主任委员李德毅院士莅临北京云基地,并为云基地题词.在北京云基地,宽带资本董事长田溯宁与李院士就云计算产业现状和发展趋势进行了深入交流,田溯宁邀请李院士成为云基地的专家董事,并授予李院士"云基地专家顾问"证书. 李德毅

工程院院士李德毅:数据挖掘就是云环境下的搜索服务

ZDNET至顶网CIO与应用频道 05月21日 北京报道(文/羽飞):在今天上午举行的第六届中国云计算大会上,中国工程院院士李德毅分享一些对云计算与大数据的认识和看法,他表示,大数据标志着一个新时代的到来,这个时代的特征不只是追求物质资源,也不只是互联网带来的信息服务,同时还包含数据资源的价值挖掘与价值转换,以及由大数据挖掘带来的精神与文化方面的崭新现象. 李德毅认为,在现今时代人们通常所说的大数据主要包括三个来源:第一,地球上的自然环境:第二,生命数据:第三,社交大数据,这些数据普遍存在于人们

院士李德毅:大数据认知(演讲全文)

导读:李德毅院士通过介绍作诗.语言翻译.语音识别.保险.人脸识别,深入浅出地阐述了大数据认知的方法学.大数据标志数据密集型科学的新时代的到来,大数据时代是小模型.小定律.交叉学科的时代.大数据认知的突破口在于聚类.提倡利用云加端的形态和深度学习,研究制造神似形不似的云机器人.介绍了驾驶服务云机器人.语言机器人,提倡研发机器驾驶脑,展示了无人驾驶客车的研究成果,介绍了团队正在进行的智能车的六类试验与评估,倡导研究者做实践中的研究,少做研究中的实践. 2015年8月14日,由中国科协.中国科学院指导

工程院院士李德毅:汽车正在被软件所改变

 5月18日,由中国电子学会主办,ZD至顶网协办的第八届中国云计算大会在北京国家会议中心举办,中国工程院院士.中国电子学会云计算专家委员会名誉主任委员.中国大数据专家委员会顾问李德毅针对智能驾驶领域方面与与会嘉宾进行了分享. 李德毅在分享中表示:"汽车成为软件定义的机器,实现了自动驾驶,汽车,曾经被称之为改变了世界的机器正在被软件所改变.今天机器人通过大量深度学习,终于可以聪明到足以改写程序中的参数量.人工智能核心不仅仅是算法更是学习,在大数据环境下充分发挥大数据碎片化认知,客观形式的认知难度,

院士李德毅:云计算再认识(56PPT+演讲全文)

静点评:李德毅院士的报告题目为<云计算再认识>,他在报告中回顾了过去历届云计算大会上认知,首次提出云计算的天梯概念.李德毅认为从图灵计算到网络计算,云计算的交互性远远超出图灵机,互联网不是一台虚拟的图灵机,交互导致众包.众挖和群体智能.他在PPT中形象地画出了实现云计算的7级天梯:光网宽带.移动宽带.互联网.云计算.物联网.大数据.人工智能,他说这座构想中的理想天梯是信息社会美好的未来,我们IT领域天梯须自强,才能不负重望,把"互联网+"承担起来.李德毅院士还说今年要创新开

百度李红:大数据时代致侵权行为复杂化

"2012中国公司法务年会"在京举行,百度高政策顾问李红在会上发言,她认为侵权形式的多样化,侵权主体多元化,客体的扩大化和数据华,侵权对象性质的双重化,侵权行为手段的智能化.隐蔽化,侵权后果的严重化.复杂化和扩大化,都是网络发展大数据时代给我们带来的新的问题. 以下为文字实录: 李红:首先感谢大家饿着肚子留下来听我们演讲,我站在这里讲可能比较容易控制时间. 我今天想在这里跟大家分享的主要是云计算环境下的个人隐私保护.当下用一个字来形容云计算那就是热.我们知道最近亚马逊在报他们云计算的收