第四范式首席科学家杨强教授:人工智能的下一个技术风口与商业风口

作为华人界首个国际人工智能协会AAAI Fellow、至今为止唯一的AAAI 华人执委,以及IEEE Fellow、AAAS Fellow、IAPR Fellow,杨强教授在专注学术研究的同时,也更关注如何让人工智能技术落地转化为生产力的问题。

作为第四范式首席科学家、范式大学的导师,杨强教授近日在第四范式公司内部进行了一场主题为“人工智能的下一个三年”的培训,深入浅出地分享了自己在人工智能产业推广上的经验,并预判了人工智能即将爆发的技术风口与商业风口。此前,杨强教授与第四范式曾提出人工智能的五个必要条件,为人工智能行业提供了权威的准入标准。

以下内容根据杨强教授主题演讲编写,略微有所删减。

一、AlphaGo为我们带来了什么

大家记得在2016年3月,AlphaGo横空出世对战李世乭,这对于人工智能的社会影响非常大。这里,我们问一下:AlphaGo到底为我们带来了什么?

在AlphaGo的搜索中,Deepmind团队引入了一个新概念——即用深度学习和强化学习的结合来做两种任务的判别,即来判别现在所在的棋盘是好是坏,同时来预测未来有利的走向。讲到这里大家应该能看出AlphaGo的算法和未来商业模式的关联,即:通过对大数据的分析,让我们对“现在状态”有了一个靠谱的理解;这个状态可以是棋盘、可以是足球运动中两队交锋的状态,也可以是当前营销的一个状态。同时,下围棋中的一步,可以理解成对未来走向的预判,在商业活动中,这可以是营销活动中的下一步。这里很重要的一点,是区分我们商业行为中的两个任务,即对现实的判断和对商业未来走向的预估。这两个任务同样重要,也同样都需要大数据的支持。
因为围棋是一个封闭式的游戏(即没有外界因素的干扰),为了得到更多的数据,AlphaGo也引入了自我博弈。所谓自我博弈就是自己玩游戏,你会得到不断的反馈,然后来更新自己的策略,经过无数次这样的比赛,最后会得到一个好的策略,你的最终输出是一个行为的策略。所以AlphaGo 也告诉我们,在一个封闭场景中,可以用自我博弈的模拟方法得到更多的数据。

从AlphaGo到人工智能的应用流程

我们如果沿着下围棋的步骤走,就要面对这些问题:你的人工智能算法的目标是什么?有没有数据?数据在哪里?问题的边界是否清晰?什么叫合理的走法、什么叫犯规的走法?你的特征在哪里?又如何得到这些特征?是否可以得到一个持续的反馈?这样的一个流程是AlphaGo设计团队所走过的路。不妨把这些步骤记下来,变成一个workflow,看看其他的领域是不是可以重复AlphaGo的成功。

比如,如果用AlphaGo治疗癌症,如何治疗呢?治疗癌症一般是用放射性来杀掉癌细胞,而每一个癌症患者需要的剂量、角度、频次可能都不一样,如果能把所有的这些信息都记录下来,再记录治疗结果,因为结果不是马上就知道的,而是经过一段时间才知道,这样就有了数据、有了特征、有了问题持续的反馈,并且有了非常清楚的目标,即在副作用最小的情况下杀死癌细胞。并且这个workflow是可以重复的。

AI的发展历史还有前30年,这些年的积累也很有用

刚刚我们说了AlphaGo的一路历程,但我们对人工智能的理解不应该片面地认为人工智能就是机器学习。人工智能的发展历史还有前30年,前30年是从50年代中一直发展到80年代中。这30年AI是在干什么呢?是在做人工输入的规则型的知识表达研究,以及基于这些规则的符号空间的推理和搜索。我认为,这个人工规则型的知识表达在AI的应用当中也是必不可少的,因为在众多领域当中还会碰到冷启动的问题,以及如何规范一个领域的边界的问题。这就是说,逻辑推理,逻辑知识表达,以及在符号空间的搜索的人工智能这个分支,在今后几年会和统计学习相结合,会大有发展。
这种发展会也涉及技术和商业两个层面。

二、AI的技术风口在哪?

我们大家会关心的一个问题, 是人工智能的技术在哪些方向可能会有大的突破。

深度学习

首先,是深度学习会继续发展。这里的发展不仅是在层次的增加,还包括深度学习的可解释性、以及对深度学习所获的的结论的自我因果表达。例如,如何把非结构化的数据作为原始数据,训练出一个统计模型,再把这个模型变成某种知识的表达——这是一种表示学习。这种技术对于非结构化数据,尤其对于自然语言里面的知识学习,是很有帮助的。另外,深度学习模型的结构设计是深度学习的一个难点。这些结构在今天都是非常需要由人来设计的。还有一个研究问题是如何让逻辑推理和深度学习一起工作,这样也可以增加深度学习的可解释性。比如,建立一个贝叶斯模型需要有很多的设计者的经验,到现在为止,基本上是由人来设定的。如果我们能从深度学习的学习过程中衍生出一个贝叶斯模型,那么,学习、解释和推理就可以统一起来了。

迁移学习

迁移学习也是我和戴文渊(第四范式创始人、首席执行官)一直在做的工作。给定一个深度学习的网络,比如一个encoder网络和一个decoder网络,我们可以看它学习和迁移的过程,作为新的数据来训练另外一个可解释的模型,也可以作为一个新的迁移学习算法的输出。即一个学生A在观察另外一个学生B学习,A的目的是学习B的学习方法,B就不断地在学新的领域,每换一个领域就为A提供一个新的数据样本,A利用这些新的样本就能学会在领域之间做迁移。所以这种过程叫做观察网络。有了这种一边学习、一边学习学习方法的算法,就可以在机器学习的过程中,学会迁移的方法。

自然语言的表示学习与机器阅读

表示学习是当数据和任务没有直接相关时也可以学,一个重要的例子叫做self-taught

learning,即我们通过很多supervise的数据、图像,可以学出一种最好的表达。用这个表达加上任务,就可以很快地学会这种知识表示。这时非结构化的数据就相当有用了。比如,给出一段话让机器去阅读,机器学习可以自动地发现一些值得关注的点。比如,给定一个文章中的实体和一个未知变量有这样的关系,然后用户可以问你这个未知变量是什么。能够达到这样的效果是因为深度模型已经具有了一种关注,这种关注是可以通过观众的学习(Attention)来表达。其结果就好像我们一目了然地看了一本书,我们会把关键词和它们的关系抓取出来。这实际上是利用类似人的一种直觉来进行学习。

人机对话系统

应该说有一个领域已经发展到了临界点,就是人机对话系统领域。现在在这个领域,某些相对垂直的方面已经收取了足够多的数据,一个是客服,一个是汽车(车内的人车对话);还有一种是特定场景的特定任务,像Amazon
Echo,你可以跟它讲话,可以说“你给我放个歌吧”或者“你播一下新闻”,Amazon
Echo里面是围了一圈的8个麦克风,这个阵列可以探测到人是否在和它说话,比如我和别人说话的时候,脸转过去,它就不会有反应。这种唤醒功能是非常准确的。它的另外一个功能是当你的双手没办法去控制手机的时候,可以用语音来控制,案例场景是客厅和厨房,在美国Amazon
Echo特别受家庭主妇的欢迎,所以像这种特定的场景,如果收集了足够的数据,是可以训练出这样强大的对话系统来的。

强化迁移学习

我们可以想象,未来深度学习、强化学习和迁移学习的结合,可以实现以下几个突破——反馈可以延迟、可以个性化,把一个通用模型施加到任何个体上面,这样一个复合模型可以叫做强化迁移学习模型。

人工智能的可靠性模型

AI
as Reliable Services是AAAI 前主席Thomas Dietterich在AAAI
2016上给出的一个主题,人工智能只能作为一些例证证明能够做哪些事情,比如下棋,无人驾驶,但很多时候它还是不可靠的。它不像现在的一个商用软件一样,能让你放心地去使用,以保证它的错误率肯定不会超过很小的比例。相反,AI

在犯错的时候可能错得非常厉害,所以用平均值来代表一个准确率是不恰当的,相反,应该更多地要考虑它的置信区间。换言之,小白用户拿一些人工智能的模块来搭一个系统,这个系统就应该能被搭出来,而且它的效果应该是在一个固定的范围以内的,所以人工智能应该像软件工程一样做出来。

第四范式核心产品“先知平台”一直就在往这个方向发展,先知把人工智能的模块工程化、并在一定程度上保证了可靠性,从而让普通用户用来搭建自己的人工智能系统。

三、AI的商业风口在哪?

上面我们考虑了人工智能的技术发展。下面我们看看商业领域。我们刚才列举了AI

成功的5大必要条件:高质量的大数据、清晰的问题定义和领域边界、懂人工智能且擅长应用和算法的跨界人才、足够的计算资源、持续的外部反馈。满足这五个条件的领域,才有可能在未来出现人工智能的爆发。

智能客服

人机交互的智能客服,产生了很多外界公开的数据以及内部的数据、知识库等,都可以用来制造机器人。尤其是可以用客服过去的数据来做训练,这个数据量现在在垂直领域是逐渐在增加的。现在的对话系统也已经逐渐成为深度学习和强化学习的焦点。

新闻领域

另外一个比较看好的领域是新闻领域,新闻的分发和自动写作。有很多编辑、解说、自动校对、作家等,其实是数据量足够多的,有这么多的文本,而且外界反馈也越来越多了。给一篇文章,可以用机器学习来做自动摘要。

这样一个工作的外部反馈来自哪里呢?实际上我们写的那些paper就是一个外部反馈,因为每篇paper都有摘要,如果一篇paper被收了,就说明摘要写的还不错,所以外部反馈还是可以实现的。

这里分享一个有趣的实验,是香港科大同学做的“自动写小说”项目。主要有两个步骤,一步是让它读很多书,一步是这样训练出一个模型,这个模型再让它变成一个生成式的模型,这样就能用来写小说了。举个例子,我们提供《射雕英雄传》和《笑傲江湖》,把这两个结合起来,就可以写一部新的小说了。

特定任务的智能机器人

例如Amazon

的KIVA机器人,大家可能知道Amazon一个很大的优势就是所有的仓储都是由机器人来完成的,但是它也有工人,被雇来用手做抓取,因为现在机器人的抓取是非常难的,那么人和机器的优点就结合起来了。此外,医疗机器人也是非常专业的一个领域,它可以给人开刀缝线,但它不是自动的,而是通过远程控制的,但控制的精密度非常高,如果它收集到足够量的数据,是可以达到自动的效果的,以后我们可能开刀就由机器人来代劳了。

在医护领域,无障碍辅助的应用领域痛点特别强烈,现在数据量可能还不是特别多,因为毕竟这一群体还是少数人,但是痛点很强,所以未来也许会有数据。

AI+有机食品

我们在香港曾去访问过一个有机食品工厂,这个实验室里的每一株菜,周边的所有环境全都记录起来,比如湿度、温度、光照,然后就可以收集这样的数据训练一个机器学习的模型,最后用这个模型来做蔬菜。所以得来的蔬菜滋味可以控制,要脆感还是要甜的,都可以通过模型学习出来。

FINTECH智能投顾

最后来说一说金融,其实金融是一个非常好的领域,第四范式在金融领域也积累了很多成功案例。金融领域里的任务都是非常清楚的,而且每个任务的数据都有痕迹、有数据足迹,数据的维度也是多维度的数据,有外界的、也有内界的,非结构数据比较多,例如文本和报告。数据也是形成了孤岛,链条也非常长,并且链条里面都有衔接。

在金融领域现在美国比较时髦的一个概念叫投研、投顾和投资。投研是说研究整个市场的基本面,就好像我们研究舆情分析一样,但舆情只是其中的一部分;投顾是说在美国的银行给很多客户做理财分析,然后做理财的配置,这些工作可以由机器人来做;投资是说机器人自己就是一个客户,它可以去投资。

四、多年后的AI社会

最后说一下我认为多年后的AI社会是怎么样的。我觉得未来应该是几个人在运行一个公司,每一个人都能率领成千上万个机器人,这些机器人在做不同的事情,也是它被训练得很擅长的事情。我们现在在一个传统行业里,往往是20%的人在做80%的工作,那么这20%的人就是未来的运营公司的人,剩下80%的人所做的工作将交由机器来完成。一个公司的自动化,智能化程度,也代表了这个公司在商业上的反应速度和竞争力。

人工智能给人类带来的变革是非常深远的,人工智能不仅仅是一场比赛、一个应用,而是整个社会真正地彻底地在改变。机器和人将成为一个共同的“军队”不断地攻克堡垒,推动人类进程向更好的方向发展。]

本文作者:知情人士

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-17 04:33:13

第四范式首席科学家杨强教授:人工智能的下一个技术风口与商业风口的相关文章

专访 | 杨强教授谈CCAI、深度学习泡沫与人工智能入门

7 月 22 - 23 日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁金服主办,CSDN.中国科学院自动化研究所承办,作为独家直播合作伙伴的第三届中国人工智能大会(CCAI 2017)将在杭州国际会议中心盛大开幕. 作为大会主席,香港科技大学计算机与工程系主任.AAAI Fellow 杨强教授最近接受了大会记者专访.这次访谈干货满满,其中有不少话题是杨强教授首度公开谈及,比如下一个 AI 突破口.深度学习泡沫.AI 之路心得.本科生入门 AI.好学生要能教导师学习,等等. (点击阅读杨强教授历史

科学式家|杨强教授漫谈《西部世界》、生成式对抗网络及迁移学习

「范式大学」由第四范式发起,致力于成为"数据科学家"的黄埔军校,校长为第四范式首席科学家,华人界首个国际人工智能协会AAAI Fellow.唯一的AAAI 华人执委杨强教授.   [范式大学]在探索AI工业化的同时,也关注最新学术研究成果.近日,杨强教授在[范式大学]内部课程中,与大家分享了他在 "生成式对抗网络模型" 和迁移学习等领域的独特见解和最新思考.在此特别感谢杨教授的博士生张颖华同学的帮助.   以下内容根据杨强教授演讲编写,略微有所删减. 有些人看过电视

香港科技大学杨强教授:AI学术的前沿工作,也要从工业界获得灵感|CCF-GAIR 2017

雷锋网(公众号:雷锋网) AI 科技评论按:在7月7日,由中国计算机学会(CCF)主办,雷锋网与香港中文大学(深圳)承办的第二届 CCF-GAIR全球人工智能与机器人峰会正式召开.今年CCF-GAIR的程序委员会主席.香港科技大学计算机系主任杨强教授,担任了大会第一天人工智能前沿专场的「AI 学术前沿」主持人.学术前沿 Session 分别由两位优秀的学术界人士进行演讲,一位是 CMU 金出武雄教授,另一位是 UCL 副教授汪军.在该 Session 结束后,雷锋网 AI 科技评论与杨强教授进行

香港科技大学杨强教授:深度学习如何才能更靠谱?

雷锋网AI科技评论按:7月22-23日,第三届中国人工智能大会(CCAI 2017)在杭州国际会议中心举行.其中来自香港科技大学的计算机与工程系主任.AAAI Fellow杨强教授发表了<深度学习的迁移模型>主题报告.本文主要阐述了杨强教授在大会中所讲的如何将迁移学习和深度学习相结合,使深度学习模型变得更加可靠,以及具体的实际应用案例. 杨强教授从深度学习模型的共性问题谈起,深度剖析如何使深度学习模型变得更加可靠,在数据变化的情况下,如何让模型持续可用.报告谈到,迁移学习有小数据.可靠性.个性

AAAI Fellow、现任执委杨强教授做客雷锋网沙龙,解读AAAI的历史变迁| AAAI 2017

AAAI 2017于今天(美国西部时间2月4号)在旧金山开幕,雷锋网(公众号:雷锋网)编辑团队也在现场.会议正式开始前,雷锋网就注意到这届大会论文收录的情况,几乎超过六成作者都是华人:而今天在会场仔细一看,一眼望去的确大半都是华人面孔. 我们在之前的介绍中也提及,这次会议原定在新奥尔良召开,和中国春节时间冲突,经过多位华人学者的努力才改期到2月4号-9号."我们之所以能在这里(旧金山)见面,也是多位华人学者共同努力的结果."在今天晚上雷锋网组织的AAAI华人沙龙上,AAAI Fello

香港科技大学杨强教授专注研究的这项新兴技术,可能能造就最初的真正“智能”

迁移学习,简单的说,就是能让现有的模型算法稍加调整即可应用于一个新的领域和功能的一项技术.这个概念目前在机器学习中其实比较少见,但其实它的潜力可以相当巨大.杨强教授在刚刚结束的CCF-GAIR上的演讲中曾提到一个愿景--利用迁移学习,即使是自身没有条件获得大量训练数据的小公司也可以按照自己的需要应用大公司训练出来的模型,从而普及AI的应用. 在目前大家都在努力提高人工智能应用通用性的大背景下,迁移学习的崛起之势已经比较明显.不过杨强教授其实早在2009年之前就开始研究迁移学习了--那时他是国内为

李飞飞:“情绪”和“情感”,是人工智能的下一个春天 | 未来论坛2017

雷锋网按:六十年前初识计算机的时候,人们就在想:是否有一天我们可以创造出一种人工智能,达到甚至超越我们人类的智能水平. 几十年过去了,AI 经过了几个寒冬.我们仍然没有了却几十年前的心愿.今天,人工智能再一次火爆全球,我们似乎看到了人类科学正在加速冲向那个奇点.产业界和学术界都在不遗余力地进行 AI 研究,甚至流行的美剧<西部世界>也在讨论人工智能. 站在今天的时点上,人工智能到底有什么突破,未来的人工智能会向什么方向前进呢? 四位人工智能界的泰斗大牛在未来论坛2017年会的圆桌对话上发表了自

或遭遇寒冬?杨强谈人工智能发展现状及前景

前不久,落下帷幕的IJCAI SocInf'16 Contest上,天池(tianchi.shuju.aliyun.com)携手人工智能国际顶级会议IJCAI SocInf Workshop,作为比赛的冠军团队T9,来自清华大学的李中杰与姚易成不仅获得了主办方提供的奖金,更取得了组织者提供的美国游基金.通过这个宝贵的机会,在整个美国行行程中,"T9"不仅接触到了AlphaGo技术小组,还与人工智能领域专家.香港科技大学教授杨强进行了深入的交流,而有意思的是,通过本次交流发现,他们初始的

巨头竞相押宝人工智能,下一个十年该看谁?

联合编译:Blake.高斐 苹果.谷歌还有Facebook都在投资人工智能,它们的计划是什么?还有哪些重量级玩家? 很难确切地说人工智能(AI)究竟会沿着哪条路继续往下走,但是随着像Google.Facebook以及谷歌大举进军该领域,还有霍金(Stephen Hawking)与Elon Musk一直在呼吁对AI研究进行规范与监控,有关它的话题绝必将持续激烈地争论下去. 本文中我们将对目前投资人工智能领域的几大巨头进行介绍: Facebook 据消息称,Facebook正在使用人工智能技术帮助盲