香港科技大学教授杨强:云计算、大数据能让每个人都享受到AI红利

 5月19日,由中国电子学会主办,ZD至顶网协办的第八届中国云计算大会进入第二日程,第四范式首席科学家、机器学习领域国际学术带头人、香港科技大学教授杨强在现场带来了“AI For Everyone”的主题演讲。

杨强表示,“我们所说的强人工智能和超级人工智能,实际上并不是我们需要害怕的东西,我们需要害怕的东西是我们的技术,一定需要大数据,但是我们本身又没有大数据这样的红利。相反我们要发展的技术是这样的,把知识迁移到身上,短时间通过小数据能够学习、能够成长,如果我们有能力把大数据的模型迁移到我们每一个人身上,我们也使得我们每一个人都能够享受到这样的人工智能红利。”

以下是杨强演讲实录:(以下内容根据现场速记整理,未经发言嘉宾确认,仅供参考,谢绝转载。)

大家好,我是香港科技大学的。

今天我们有人工智能的技术,我们大家都为它的成就欢呼,但是我们手边,我们是不是人人已经享受到人工智能的红利呢?我们带着这问题来回顾一下人工智能的发展历程。首先我们要看人工智能的起始是要感谢这位思想的先驱图灵,他问的一个问题就是机器可以思维吗?我们今天的努力,也是跟很多前人的铺垫是分不开的。有哪些努力呢?我们可以看一下,从50年代开始,大家就在做各种假设,提出各种问题,毕竟一开始的时候,大家总是非常的乐观,认为一下子就可以解决,但还是提出了很多关键性的问题,比如说机器可以学习吗?机器可以规划吗?机器可以推理吗?等等。

比方说我们把老专家的一些思考、一些思维和知识给它迁移到计算机里面。但是后来发现这个过程实际上是非常非常艰难的,因为把知识描述出来,把知识表达出来,把知识学习出来,并不是那么简单的事。

在这个过程当中呢,也有很多的努力,在不断的积累,比方说IBM为首的服务器的制造商,在1990年代就在象棋领域就把人类的冠军给打败了,这个也是一个里程碑。这说明什么呢?说明要取得人工智能是离不开计算能力,同时机器学习的研究者也取得了很大的进展,总而言之有很多的努力,这些努力被圈在实验室里。这个就总结一下,在人工智能就是AI For No One其实很强的原因是数据量的不足,也是因为当时并没有这么便利的云计算,能够帮助我们收集这么大的数据,比方说利用群体智能、群体智慧、手机、网络等等之类来聚集大量的数据。到了今天人工智能活起来,有几个原因,第一个原因确实汇聚了很多的数据,可以想象谷歌公司,还有国内的互联网公司,都汇聚了这样很多大数据。今天的计算能力是突飞猛进的。第三是今天的算法,有很大得逞就。像深度学习、像强化学习等等之类的。这样我们有目共睹的成就,比方说可以做机器的同声翻译,我们可以做非常好的人脸识别,使得我们基于图像的搜索就变的非常便利,这个也是感谢科学家的努力,我们对图片还要进行标注,这还要发动广大的群众来进行标注,我们系统可以做的聪明一点,来识别哪些标注,所以这比赛最后就导致了深度学习算法的非常大的成功,比方说就提高准确率方面,提高至少10%,从不能用的阶段到可用的阶段。

同时深度学习模型,作为一个辨别性的模型,它也可以转化成一个生成模型,比方说现在我们看到这个图,就是谷歌训练好的图片识别性转化成生成器,这是像深度学习描绘那些印象最深得情景,机器潜意识怎么回事。斯坦福的科学家就可以面对这样的图片去问一些自然语言的问题,用文字来问问题,在图片里面得到答案,再用文字来回答。我们可以拿一个著名画家就是印象派,我们把这图片变成印象派这也可以做,这就深度学习帮我们做了。我们看今年的阿尔法狗今年非常火,KGS让网上对议围棋的网站,经过十几年的积累,它已经积累了非常非常多的棋谱,这个里面通过可以产生3千万的盘面来训练,没有这个也没有阿尔法狗。所以呢我们说云计算一定是人工智能的前提,尤其在今天。第二个例子我们看到IBM我们知道在2011年击败了电视节目的世界冠军,它应该鸣谢谁呢?就是在网上有很多的知识这个知识也是很多人积累努力的结果。

所以这里不妨做一个比喻,人工智能是怎么产生的?这个能力要感谢两个事,一个是生米一样,还没有变成熟饭,但是把它做熟是感谢人工智能,从互联网到人工智能的转变,我们看到这些成功还是集中在大公司提供了一个思考的起点,对于其他的领域,这些领域没有大数据,我们应该怎么办呢?人工智能是不是对他们就没有作用了呢?他们是不是就没有能够享受到人工智能的红利呢?比方说在生物信息领域,我们知道可以获得很大的一个数据,这个数据是单条的基因链,或者是蛋白质链。但是我们把它和人的行为对应起来,这样的数据,确实是少之又少,往往在生物信息领域能够得到几千条样本已经是相当不错了。这个和图像识别里面上千万个样本,那简直就没法比的。所以深度学习到今天对于生物信息领域的大部分数据还是没有用的。

再举一个例子呢,是教育领域,到现在积累大量的数据,所以我们再回来看,刚刚讲的这些红利,实际上大部分的企业是没有办法享用,这就为我们带来一个问题,我们应该怎么办?总结一下到今天的这些成就,也仅仅是AI For No One,对某些人,对某些富人、对某些具有大数据的人工智能是有用,但是对于我们大部分的人,我们只能旁观。当然我们的志向尤其是做研究,让所有的人都能享受到这样的红利,因此我们在研究所,我们在学校,应该做什么样的工作?能够使得这一件事发生呢?我们在讲这些技术之前,我先来回顾一下,对人工智能的恐惧,我们在过去我们是靠走路,现在变成骑马,甚至有汽车,因此人工智能为我们带来的红利也就使得我们人能够能力变成扩大,我们人的能力变成更有能力。这样的话,而使我们每一个人变的更加强大,基于这样一个观点,我们希望所有的人都能够享受到人工智能带来的好处,每个人都有一匹马,每一个人都有一辆车,这样就是AI For No One。我们怎么能够让这个事发展呢?结合我们自己的研究。机器越来越强让每一个人都享受这样的红利。

所以总结起来我们看到18世纪发展了工业大革命,通过资本来使得某一些资本家变的越来越强大,穷的越来越穷,富的越来越富。我们不希望看到这样的现象发展,今天这革命其实也有这样的危险,就是智能革命,实际上数据是资本,数据是石油。有数据的人能够提供越来越多的服务,他也就能够得到更多的数据。会不会形成一些智能寡头呢?这个我们认为才是对人类最大的危险,并不是人工智能本身,而是这种数据的现象就像金融发生的一些,这里我要特别提我们确实在做努力,其中一个努力是迁移学习,比方说右边这里是一个著名的心理学家,他做了一个实验,使得新的领域学习效率大大提高,这为我们提了一个什么启发呢?如果我们在计算机也能做到迁移,就可以使得在数据少的情况下,数据一定的情况下,我们的效率能够提高,并且在效果一定的情况下,我们用的数据就不用那么多,也就是说我们遇到一个新的领域,我们如果有能力,把一个过去的模型迁移到新的领域,我们在新的领域并不需要那么多的数据,所以小数据也可以享受人工智能的福利。比方说我们在推荐的领域,像在刚才这一位讲,京东、阿里,像国外的亚马逊,大量的推荐任务,如果有一个新的领域,我们没有很多新的数据,这个问题在推荐领域叫冷启动问题,解决冷启动的方法,就是过去大数据建好的模型,来把它迁移到一个新的领域,使得新的领域,只要得到少数的数据,也可以工作的很好,这些实验我们都做过。

同时我们可以让机器去读一些文字,把这些知识给变成能够对图像有用的知识,这样知识就可以在不同的表达之间做迁移。我们做了一个是研究说明也让机器读多少文字,它就可以来帮助你识别图像足够好呢,我们就发现其实就相当于我们经常说的那一句话,一幅图片,相当于一千个字,所以这个我们也通过这实验来加以证实,也就是说书并不需要无限的读下去,这对于大部分学生来说这是一个好消息。

这里我就要提到现在很热的另外一个领域,就是穿戴式智能硬件,我们知道穿戴式是非常酷的,但是如果它不提供足够的服务,有一天它也会败落下去。这些服务来自于哪里呢?来自于对数据的解释,我们一个人戴了一个手环,我们这个人在走、还是在睡觉、还是在吃饭。如果这手环背后的云没有办法来识别,它就不能够提供对应的服务。但是如果需要来识别,它就需要有一个足够好的模型,这个模型我们可以通过迁移学习来得到,比方说我们在一个领域,我们已经收集了很多女孩做咖啡的数据,我们就可以把这样的数据给迁移到老人在做茶,不需要很多的做茶的数据,我们就可以做一个很好的模型,这实验我们也做了通过MIT收集的数据,是相当的成功。

我们还做了一些比较有趣的比方说通过图片能够自动产生对应的诗歌,这个是公司做的一个,就是自学习的实验,这是一个我们小的时候,可能玩过的游戏,这个游戏交给计算机,通过自学习,最后强化学习,能够做到这一点,最近我们把迁移学习和强化学习相结合,也做了一个非常好的,使得不需要训练很长的时间,我们就可以把新的游戏给学会。

这里我要说,迁移学习并不是仅仅在实验室这些有趣的实验里面,它在工业上、尤其是在传统工业上,也可以大批的应用。这里我要举一个例子就是千万级微信公众号上面,我们有很多这样的数据,我们怎么样能够利用这样的数据来识别,针对最有可能性的客户,怎么做客户识别呢?如果通过人来做,一个人也就能少于几十个,最多一百个这样。但是如果我们能够通过大数据来做的话,这个就非常成功了,就可以对上亿的人进行甄别,这个是非常成功。但是这些款项往往都是小额的贷款,但是大额贷款我们能不能做一个对应的模型,实际上用深度学习来做是非常难的?为什么呢?因为大额贷款本身发生的事情就非常少,没有足够的样本。

最近我们通过迁移学习把小额贷款的大量的数据产生的模型,迁移到少数数据大额贷款少数样本这样问题上,也取得了非常大的成功。这个也是让我们觉得非常高兴。对于小数据的人终于能够享受到这样的人工智能红利了。

我总结来说呢,就是我们所说的强人工智能和超级人工智能,实际上并不是我们需要害怕的东西,我们需要害怕的东西是我们的技术,一定需要大数据,但是我们本身又没有大数据这样的红利,就好像我们大家都看过狮子王里面的坏狮子,它就想把所有的资源集中在自己的身边。这样豪门更豪。相反呢我们要发展的技术是这样的。辛巴这样一个有很多的人帮助它,他们把知识迁移到辛巴身上,使得短时间通过小数据能够学习、能够成长,我们每一个人都是一个辛巴,如果我们有能力把大数据的模型迁移到我们每一个人身上,我们也使得我们每一个人都能够享受到这样的人工智能红利。

  

原文发布时间为:2016年7月6日

时间: 2024-10-27 15:22:42

香港科技大学教授杨强:云计算、大数据能让每个人都享受到AI红利的相关文章

微软开启大数据平民化时代 每个人都能当Mr.Big

我们的城市中有一位Mr Big,他是如此的巨大以至于拥有改变世界的力量,他能够看到正在发生的一切,能够预知将要发生的未来,帮助我们创造动人的惊喜,它能够看到发生的一切--有了大数据,谁都可能成为Mr.Big. 图为微软全球高级副总裁,大中华区董事长兼首席执行官贺乐赋(Ralph Haupter)在微软大数据战略发布会上演讲 上面这段话摘自昨天微软在北京发布其大数据战略时现场播放的一个短片,这个短片形象.直观地展示了大数据的魅力所在.与其他厂商不同的是,微软大数据战略强调利用简单的工具来实现大数据

云计算大数据时代个人隐私保护刻不容缓

随着云计算大数据时代的到来,互联网将时时刻刻释放出海量数据,随着产生.存储.分析的数据量越来越大,无论是围绕企业销售,还是个人的消费习惯,身份特征等,都变成了以各种形式存储的数据.大量数据背后隐藏着大量的经济与政治利益,尤其是通过数据整合.分析与挖掘,其所表现出的数据整合与控制力量已经远超以往.大数据如同一把双刃剑,社会因大数据使用而获益匪浅,但个人隐私也无处遁形.近年来侵犯个人隐私案件时有发生,如谷歌泄露个人隐私事件.盛大云数据丢失事件.2011年韩国三大门户网站之一Nate和社交网络"赛我网

第八届中国云计算在京召开:云计算大数据加速发展

由中国电子学会主办的第八届中国云计算大会5月18日~20日在北京国家会议中心盛大召开.本次会议由工业和信息化部.中国科学技术协会.北京市人民政府指导,中国云计算技术与产业联盟.中国大数据专家委员会.中国电子学会云计算专家委员会承办,世界工程组织联合会创新专委会(WFEO-CEIT)作为协办单位,ZD至顶网.计世资讯.锦囊专家协办,大会主题为"技术融合,应用创新".工业和信息化部副部长怀进鹏出席会议并讲话,云计算大数据领域的9位院士和200多位专家在全体大会和专题论坛上作报告,三天共有超

云计算大数据“一带一路”国际合作论坛在京举行

本文讲的是云计算大数据"一带一路"国际合作论坛在京举行[IT168 资讯]2017年6月13日,由中国电子学会主办的云计算大数据"一带一路"国际合作论坛在北京国家会议中心成功举办.中国科协国际联络部副部长王庆林出席会议并致辞.中国电子学会副理事长兼秘书长徐晓兰主持开幕式. ▲中国科协国际联络部副部长王庆林致辞 ▲中国电子学会副理事长兼秘书长 徐晓兰 主持开幕式 中国.印度.新加坡.斯里兰卡.缅甸.尼泊尔.澳大利亚.乌克兰.塞尔维亚.立陶宛.保加利亚.沙特阿拉伯.孟加

“互联网+”助推云计算大数据落地 安全可控是根本

ZDNet至顶网服务器频道 03月18日 新闻消息:在十二届全国人大三次会议上,李克强总理在政府工作报告中首次提出了"互联网+"行动计划.所谓"互联网+",政府工作报告如此解释:推动移动互联网.云计算.大数据.物联网等与现代制造业结合,促进电子商务.工业互联网和互联网金融健康发展,引导互联网企业拓展国际市场.这是云计算.大数据.物联网等新一代信息技术首次在全国政策性大会议中提上议程,"互联网+"作为生态战略,也是首次上升成为国家的战略,说明在中国

揭密出席第九届中国云计算大会的专家—近20个国家学者共话云计算大数据生态、应用

2017年6月14日-16日,一年一度的第九届中国云计算大会将在北京国家会议中心拉开大幕.中国云计算大会迄今已经成功召开八届,历届大会都受到云计算大数据领域院士.专家.产业高管.技术大咖以及其他各界人士的关注.支持和参与. 那么,今年围绕"生态构建 云化应用"的主题,又有哪些院士.专家.大腕将坐镇现场,共同为大家呈现一场云计算.大数据的科技盛宴呢? 近日,大会主办方透露,多位院士(拟)将出席本届大会,为大家带来具有权威性.前瞻性的主题分享,其中包括中国科学院院士.中国电子学会云计算专家

《数据分析变革》作者Bill Franks:云计算大数据融合物联网 推动智能创新

5月18日,由中国电子学会主办,ZD至顶网协办的第八届中国云计算大会在北京国家会议中心隆重举办.大数据著名专家.畅销书<数据分析变革>作者Bill Franks先生出席了本次大会,并在大会上做了主题为"云计算大数据融合物联网 推动智能创新"的精彩演讲. 大数据著名专家.<数据分析变革>作者 Bill Franks Bill Franks在主题演讲中表示:"我们需要思考跟物联网相关联的事情,特别是一些分析,我们这些数据可以用来做什么?我们在哪里处理这些数

哈佛教授用3个大数据案例告诉你:大数据,重要的不是数据!

 "满城尽谈大数据",但很多人其实并不理解大数据真正价值是什么,哈佛大学Gary King教授用3个大数据研究案例告诉你:有数据固然好,但是如果没有分析,数据的价值就没法体现. 2017年初,哈佛大学政治学系教授加里·金(Gary King)在上海交通大学举办了一场名为<大数据,重要的不是数据>(Big Data is Not About the Data)的讲座. 主讲人Gary King是哈佛大学的校级教授(University Professor).King教授以实证

广元云计算大数据中心一期项目10月底投用

广元市加快推进云计算大数据中心项目(一期)建设,预计10月底前将初步建成并投入使用. 项目分三期进行 一期采用两步走方式 2014年9月,六届市政府第70次常务会议通过<广元市智慧城市总体规划>.2015年,广元市经济和信息化委员会启动<广元市云计算大数据中心项目预可研报告>(下称<报告>)的编制. 参照四川省政务云建设规模,根据<报告>,结合广元智慧城市建设实际,在征求各单位意见,召集信息化专家多次讨论,并与国内知名大数据云计算建设运营单位和通信运营商反复