张首晟:大数据、人和机器智能演化

张首晟,">斯坦福大学物理系教授,“欧洲物理奖”获得者,美国艺术与科学院2011年新增院士。张首晟于2006年提出拓扑绝缘体理论的材料实现方案,将其基于芯片业未来提出的新构想——通过控制电子的自旋运动来降低能耗——在理论上完成了预言。2007年,这一理论预言在他与德国维尔茨堡大学实验小组通过实验证实。2012年8月张首晟教授荣获国际理论物理学领域最高奖“狄拉克奖”。2013得获国际基础物理学前沿奖。

通常的电子在硅片里面的运动完全是杂乱无章的。“量子自旋霍尔效应”找到了电子自转方向与电流方向之间的规律,利用这个规律可以使电子以新的姿势非常有序地运动,“就像高速公路,分车道里行驶的车辆一样”,张首晟教授说。“这样能量耗散会降到很低。”这一物理发现有可能给未来的信息革命带来重大影响,电脑甚至量子计算都将随之发生巨大改变。张首晟教授也提出:“可能在十年后目前的半导体技术潜力用完之时,会出现基于量子自旋霍尔效应的新一代电脑。”

正如在《复苏》(renewal)一书中,特拉维斯·吉布斯提出的,“遗传,就是要我们记住那些已经奏效的东西。”张首晟也认为,“人之所以能够具备智能,是通过几百万年的进化。今天大脑那么聪明,其实也是经过大数据的训练。计算机没有发展那么长的时间,只能用整个空间的分布来缩短它进化的时间。现在通过大数据和机器学习,我们可以加速的实现这个进化。”

张教授认为,人类的大脑,因为它的储存量到底不是那么大,所以它对信息、数据有个筛选的过程,大脑是做的特别好。“其实我们人忘记事情,是很重要的功能。今天对于大数据,如何对涌进来大量数据进行预处理也是关键。”张教授说。“事实上因特网现在要做的事情,很重要的也是对于知识的排序和管理。”他举例说,谷歌之所以成功,最早期开发的pagerank功能很重要,它就是一个排序的功能。“今天对大数据,对知识,怎么对它进行有效地管理,也是最重要的事情。可能维基百科通过人工在做的一些,可能还需要更深层,比如说知识图谱,谷歌的pagerank只是一维的评价。”张教授说。

为什么要管理和整合这些数据,张教授说:“2012年,我在斯坦福专门开的一门课上,我曾讲了一个挺有趣的故事。我说2012年,正是预言的‘世界末日’,联想到了诺亚方舟的故事。诺亚方舟当时是洪水,现在大数据带来很多好处,同时也像一场大的洪水。你一定要在那么多的数据里面,通过它总结出最高的智能(知识),还要能够有个智能的排序。所以,现在碰到最有趣的问题就是怎么自动的来整合、管理这些数据。”

张首晟认为,机器学习(deep learnnig)具有很大得空间。他提出,最近一些主要的发明,都是在这个算法上的一些发明。正如人的学习具有不同的抽象的层次,机器也是一样的。比如机器下棋为什么难?按理说如果有一个计算机,我就可以将所有步骤的可能性全算出来,但是这些计算其实是指数增长的。随着棋盘的大小,复杂性也是指数的增长。即便今天,我们计算机的能力这样增长,遇到指数增长的问题,我们还是要找到一些非常巧妙,比较近似的,但是基本上对这个问题解决的比较好的方法。

就像“谷歌翻译”就的确是一个非常重大的发明,张教授说:“本来学自然语言,都是要有很多专家对语言的理解。现在一个数学模型做完了之后,谷歌通过扫描,把几乎所有的图书数据存储过来,机器通过程序慢慢自己分析这个语法。计算机看了之后,有了这个感觉之后有这个语法,有这个语法的概念在后面。”(这也是大数据全量数据和相关性的体现。)

“本来机器翻译就是有两派不同的思潮,有一派的思潮就是说我要把语法、知识怎么灌输到机器里面去;现在就是谷歌说忘掉语法,通过写一个好的学习程序,让机器看那么多的东西,让它自动总结出这个语法的概念。”张教授认为:这个时代之所以那么激动人心,就是我们两件事情在同时做。一个在理解人的脑子,还有一个是想通过大数据,拓展人类的智能。机器和人互相反馈,也许能催生新的科学大发现。

最简单的,他距离说就像自己做研究的时候,最想要的就是计算机能够根据自己以前看的论文,根据看文章的习惯,自己写的论文,以及做的笔记,可以到全网络上去找,计算机知道他理解问题的风格,知道他对什么东西感兴趣,如果能够经常给他一些好的文章或论著,反馈给他,他我就可能做出更多的成果。事实上通过这样的例子,张首晟觉得人的智能和机器的智能是可以互动的。

甚至人和机器的智能还能互相提升,张首晟同样以谷歌的例子,阐释和人和机器怎样能够在智能提升上达到一个双赢。他说谷歌图书拥有很多的书。但是在扫描这么多书的时候,就会有一些错误,机器怎么也辨识不出来,这是一个问题;另外还有一个看似截然不同的问题,就是很多人会通过计算机去攻击一些网站。因而说我们去邮箱,或者银行账号登录的时候,就可能会让你填几个验证码,这些验证码最好要是计算机认不出来的东西,只有人才能认出来。卡梅隆大学就想出一个办法,把这两个东西放在一起:就是在谷歌图书扫描的时候,发现有一些认不准的,它就放到诸如银行页面登录验证的地方让人来认,本来这个问题一个是矛,一个是盾,现在两个东西放在一起就解决了这个问题。同时给出两个,一个是计算机本来已经知道的,故意模糊化一下,;还有一个谷歌在扫描书的时候也认不准的,最终对比大家提交的答案,大部分人相同的可能就是正确的。这个其实是一个很好的例子。两个难题通过这种大数据方式得到了一种相对简单的,比较好的解决方案。

(责任编辑:蒙遗善)

时间: 2024-11-09 03:41:38

张首晟:大数据、人和机器智能演化的相关文章

斯坦福大学张首晟教授:大数据时代的机遇

2014年11月13日,"The New Billions"--中美创业新贵硅谷峰会暨2014创业邦年会继续在圣克拉拉会议中心(Santa Clara Convention Center)举办. 斯坦福大学教授.2015富兰克林物理奖得主.丹华资本董事长张首晟先生做了主题为"斯坦福的创新以及硅谷的天使投资"的演讲.他认为斯坦福生态圈就是一个返回机制,知识创造财富,财富返回创新和知识.在他看来,今天时代的机遇来自于大数据,用自然科学的方法,可以发现看起来杂乱无章随机的

斯坦福教授张首晟:大数据时代感受物理、科技、人文的跨界之美

从小我就酷爱读历史,那些可歌可泣的故事深深地打动我的心灵,历史似乎就是一盘棋,命运时时在那些伟人的掌控之中.然而,我也经常会问一些可笑的问题,例如:当年如果荆轲刺秦王成功,中国的历史将会如何演化?如果布鲁图刺杀凯撒大帝不成功,欧洲的历史又会怎样?如果普鲁士军队来到拿破仑与威灵顿打得不可开交的滑铁卢战场迟了两小时,世界又将转向哪个方向?如果,如果--人类的历史好像就被那些偶然的因素牵着走.? 学习物理把我带进了另一个世界,牛顿方程下的宇宙,就像一个瑞士手表,每分每秒都在精密地运转.小到树上的苹果,

斯坦福教授张首晟谈人工智能与未来

编者注:张首晟教授是美国文理科学院院士.美国物理学会会士.中国科学院外籍院士.美国国家科学院院士,现任斯坦福大学J.G. Jackson和C.J. Wood讲座教授.他的主要贡献包括对拓扑绝缘体.量子自旋霍尔效应.自旋电子学.高温超导等领域的研究,他领导的研究团队于2006年提出的量子自旋霍尔效应被<科学>评为2007年"全球十大重要科学突破"之一,他本人也被认为是诺贝尔物理奖的有力竞争者之一. 2016年9月9日张首晟教授在重庆发表了有关人工智能与科技创新内容的演讲,介绍

美国科学院院士张首晟:摩尔定律即将失效,人工智能怎么化解这个尴尬? | 2017 IT领袖峰会

雷锋网按:在IT领袖峰会下午的<颠覆性技术与人类未来>高端对话上,斯坦福大学物理系讲座教授.美国国家科学院院士.美国艺术与科学学院院士.中国科学院外籍院士张首晟针对未来的颠覆性技术发表了自己的观点.张首晟一直在拓扑绝缘体.量子自旋霍尔效应.自旋电子学.高温超导等领域做研究,他领导的研究团队于2006年提出的量子自旋霍尔效应被<科学>评为2007年"全球十大重要科学突破"之一,他还被杨振宁认为是下一个华人诺贝尔奖获得者. 人工智能就是当下最具颠覆性的技术,这一点不

国内首家大数据交易所成产业发展引爆点

文章讲的是国内首家大数据交易所成产业发展引爆点,近日,2016年贵阳国际大数据产业博览会在贵阳开幕.此次峰会吸引了包括腾讯马化腾.阿里巴巴马云.百度李彦宏等在内的IT行业"大佬"悉数到场.而后,中共中央总书记习近平在贵阳大数据广场考察时又提到"贵州发展大数据确实有道理."一时间大数据成为了社会各界关注的热点.与此同时,全国首家大数据交易所落户贵阳,瞬间成为了国内大数据产业发展的引爆点,大众都在翘首以盼等待大数据时代的全面袭来. 如何理性地迎接这股大数据的热潮?如何将

中科院大学开设首个”大数据技术与应用”专业方向

一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;淘宝每天的交易数据超过20TB--数据,已经渗透到每一个行业和领域.大数据时代,人们也越来越多意识到数据的重要性. 然而,"看得到,摸不着;摸得着,抓不住"是人们对大数据的普遍观感.如何盘活http://www.aliyun.com/zixun/aggregation/35695.html">数据资产,使其为国家治理.企业决策乃至个人生活服务,也是目前最迫切的需求. 为满足这一需求,中国科学院大学开设首个&quo

红帽张先民:大数据推动中间件的普及

本文讲的是红帽张先民:大数据推动中间件的普及,行业研究公司IDC根据一年内所有创建,复制和使用的数字数据进行统计测算后,预测称大数据在2010年到2020年期间将实现50倍的增长.当今的企业不仅要关注如何存储浩如烟海的数据,还在不断努力的去分析数据.他们要想取得成功,就必须跟得上数据的数量和种类不断更新和增长的速度. 业务的运转需要依靠数据,但是大数据所涉及的数据集是如此的庞大和复杂,以致于数据的存储和使用变得异常繁琐.从可预见的未来来看,企业用户将继续依赖专为大数据应用软件而设计的基础架构来保

清华首招大数据硕士,培养“π”型人才

清华首招大数据硕士 在清华大学建校103周年的大数据时代高端论坛探讨上,作为重要内容之一,清华大学宣布与山东省青岛市合作,正式成立"清华-青岛数据科学研究院",将开展大数据科学研究,并培养具备大数据思维和创新能力的复合型人才. "大数据的运用,将颠覆人们的传统认知,推动基础理论和学术思想的重构,乃至社会的重大变革.清华大学与青岛市的此次合作,是学校从国家战略需要出发.主动应对大数据时代的重要部署,不仅将引发学科建设.科学研究等方面的深刻变革,而且还将有力推动人才培养和教师队伍

复旦、交大牵头成立全国首个大数据试验场联盟

今天(2日)上午,由复旦大学和上海交通大学共同牵头,29家高等院校.研究所.企事业单位在上海联合成立了全国首个大数据试验场联盟. 2013年7月,上海市发布了<上海推进大数据研究与发展三年行动计划>(2013-2015年).2016年9月,又发布<上海市大数据发展实施意见>,并于10月获批成立国家大数据示范综合试验区.如今,上海在大数据产业上再度发力,今天成立的这个大数据试验场联盟,将打造大数据试验场产业生态圈,为上海全球科创中心建设提供大数据驱动力. 创新发展是强国之路,创新理论