AI大咖专访丨阿里靖世:博士的研究同样可以在工业界做,更可以影响亿万人的生活!

盖坤,花名靖世,阿里巴巴资深算法专家。

如果他从办公室的过道中走过,常常会引起周围女生的侧目。

他可是某年阿里妈妈团队女神公选的四大男神之一,在他的粉丝后援会里,横跨20岁出头刚毕业的少女粉和40多岁的风韵犹存的亲妈粉!

加入阿里之前,他是一位清华大学的博士生,期间主攻机器学习和计算机视觉的研究。

他的专研精神从那时开始一直弥漫。

博士期间,他在国际顶尖期刊和会议(包括TPAMI,NIPS,CVPR,AAAI等)上发表多篇学术论文,还获得了中国人工智能协会优秀博士论文奖。

2011年毕业后加入阿里巴巴,从事广告和推荐系统中的算法研究,带领团队提出了大规模非线性学习算法,在多个广告和推荐场景获得显著效果提升;组建了阿里妈妈图像团队,在Logo检测、OCR等关键任务上获得了效果突破,在商品审核和商品投放中发挥了重要作用。目前负责阿里妈妈精准展示技术部。
如果你有机会和他一起吃饭,他一定会饶有兴致地把餐桌上的蔬菜都为你讲解一遍。

“你知道吗,油麦菜和莴笋其实来自于同一种植物,只不过前者是叶用,后者是茎用。”

在同学们面临毕业抉择的当下,我们为大家采访了这位可爱的博士,他分享了作为一名博士生,从毕业择业到进入工业界的经历,相信对大家会有很多借鉴意义。

从学术界到工业界的选择

提问:当时在毕业的时候,在选择择业机会的时候,有哪些考虑?

靖世:当时其实主要考虑的有两点吧:一是希望做一些研究跟应用结合的东西。我在学校的时候,主要是做研究工作,会觉得这个对世界的影响有点不是那么直接。然后就想做一些应用工作,但也不想做那种纯应用,一点研究性质都没有,不想把自己的积累和兴趣断掉。
第二是想看看这里面的平台跟空间有多大。当时正好阿里巴巴在开始组建机器学习系统跟平台,而且阿里本身的平台跟业务空间特别广,会觉得在这里面研究跟应用能够达到一个平衡跟结合,所以这是当时的考虑。

提问:什么时候开始接触阿里,为什么加入阿里?

靖世:当时阿里在清华做宣讲的时候,我当时没去,我同学去了,说问了之后说没有这方面(AI方面)的需求,所以后面就没考虑了。偶然有一次,当时铁相(后来成了我的主管)在学校的论坛,当时叫水木清华,发了一个招聘帖子。帖子说阿里在做的一个大规模的机器学习的东西,然后就去聊了一下。
当时其实已经聊过MSRA跟IBM CRL了,原本主要看的是这类研究院,觉得从学术界到研究院可能会稍微平滑一点。但是我也了解到他们在应用方面并不是很顺畅,也会担心研究院跟学校区别不大,反而不一定有学校纯粹。

跟铁相聊完后,发现阿里在机器学习上有很强的决心,业务对这块的需求也特别强烈,这会驱使公司持续投入。而且整个业务体量特别大,可以支撑很多技术研究和应用,一个研究跟应用能够平衡结合得比较好的地方。

当时可能宣讲会上并没有一个主管能够去描绘清楚这条道路,铁相对这方面人才的要求、未来的发展等等都说得很清楚,就是这个契机吧。

博士的挑战与优势

提问:加入到阿里之后,从学生到正式的员工,从纯研究到研究和应用相结合,这个过程有没有遇到什么问题,不适应的地方,怎么解决的?

靖世:会有一些。其实我加入阿里的时候,除了带着知识,其它什么也没有,更不用谈一些现成的解决方案。所以第一段时间,应该说小半年吧,主要就是熟悉环境、业务特性、数据特性,以及从技术到应用的流程。

这期间有点不知道自己的价值在哪,对应用没那么熟,自己的知识储备跟这边的业务、数据也还找不到到结合点。但是这小半年其实一直在思考技术方面的解决方案,对一些重点的项目,研究这里面到底有什么问题困住了应用的效果。这段时间可能需要沉住气,而且需要持续的思考,把这个阶段渡过去。

提问:在这个过程当中有没有你的主管或者同事给到你一些帮助,让你能够缩短这个过程?

靖世:我当时的几任主管以及业务合作方的leader,对我的帮助和影响蛮大的。他们比我更了解真正在Work的业务背后的技术是怎么运转的,什么东西比较关键,什么东西会有比较大的影响,我们会经常一起讨论;

我经常会提出一些想法,有些不靠谱,有些靠谱,他们往往持一个非常鼓励的态度,对一些跟传统方法不一样的点,会跟我讨论,这个我觉得其实对一个新人非常受用。

我记得当时提了一个新的机器学习算法,提出来之后,大家讨论的时候有一大堆质疑,它Work不Work,能不能够收敛等等。然后我的主管觉得,那些问题在做出来之前不能完全讨论清楚。但是他看到了这个新算法的潜力,他觉得我可以去试一试,后来整个大家的疑问也是在一次次迭代的尝试中慢慢打消的。刚开始其实问题比潜力更多,如果不看潜力只说问题的话,可能这个事情就结束了。

提问:你在阿里其实也做了很多事情,能不能讲讲你觉得成就感比较高的事情?

靖世:到阿里之后,前期其实是在做一些新的机器学习算法跟模型的开发,然后也是希望这些算法跟模型能够赋能业务,在业务里面取得更好的效果。我在前期开发了一个叫分辨线性模型MR的算法,这个算法在多条业务线都变成了主力模型,为其中的机器学习应用和业务效果的持续增长做了很大的贡献,这个是前几年持续在做,持续在优化并且细化,做完整的一个事情。

这两年做的是深度学习平台跟深度学习算法的一些开发。深度学习上面如何跟互联网数据进行结合还是有很多挑战性课题的,我们也是做了一些工作有了一些成果,也对外公开了。团队其实在这方面还有非常多的积累,下一步也是希望这些东西能够跟业界进行更多交流。

提问:从一名校招生成长为资深专家,你觉得博士的经历对你的工作有什么影响?

靖世:我感受到最大的帮助是两个:第一是对韧性的锤炼。读博的时间一般是比较长的,通往毕业的道路大多数都不是一帆风顺的,不管你发论文顺不顺利,毕业这件事总是会面临某些坎坷。博士对我的影响除了知识,最大的大概就是培养了韧性和沉得住气的精神。很多时候一件事不能马上够到结果的时候,或者做到比一般人更大一点的时候,都需要非常强的坚持跟韧性在里面。

第二是科学素养方面。机器学习相关的理论跟一些算法的研究方法,用严谨的科学去看待问题的态度,这些对工作会有直接的帮助。我觉得偏理论方面的底子,在工作期间其实是挺难补的,反到是偏方法层面的东西在工作期间还可以快速地学习到。

提问:你当初的博士同学们现在都在做什么?和他们相比,你觉得现在的你有什么不同?

靖世:实验室因为是机器学习方向,所以他们大部分都是在机器学习相关的工作上,基本上以我这届为分界点,之前的可能更多的在研究机构,之后的更多的在工业界。跟在研究院的同学相比,可能我在真正解决实际问题、在应用场景中实现结果的能力上会突出一些。

工业界或许有更广阔的天地

提问:怎么看待现在很多学术界的人才加入工业界?

靖世:我觉得这是一个趋势吧,是一个很好的时机,工业界的应用跟学术界的最新进展其实是结合的,尤其在机器学习方向的结合前所未有的紧密。也说明目前的研究已经到了一个能应用或者潜在能应用的临界点,所以工业界特别关注,学术界的资源也在加快跟工业界结合。

而且两者之间的界限会越来越窄,这种研究跟创新性的工作并不局限于在学术界做,甚至更多的已经转到工业界了,因为工业界需求很强,舞台也比较大。工业界能提供的研究资源,比如数据、计算能力也会更强。

对于学术界转移到工业界的同学,可能有个挑战是要先摸清楚业务跟应用,摸清楚之后才能很顺畅的把这种研究结果和研究能力注入到实际的业务里。

提问:你觉得从你团队,或者说整个阿里,具备什么样素质的博士生才能够更好地加入阿里,去做一些事情?

靖世:我是觉得可能是需要有一个比较好的一个专业底子,然后在方法上有创新的精神,创新跟钻研的精神,对业务跟应用要有比较强的兴趣。这三点都具备的话,我认为是一个比较好的一个博士生。这样的同学会更快适应工业界,也更容易出类拔萃!

提问:哪些岗位或领域里面,阿里急需博士的加入?

靖世:我看到的主要是机器学习、NLP、图形图像、语音交互、运筹优化等人工智能方向,阿里这方面的投入、业务场景会越来越大,然后对结果的期待也会很大,我们在这块急需的人才,包括资深的研究人员跟刚毕业的博士生。当然我们我们在研发类岗位上,也需要博士的加入。

提问:对于即将面临毕业的博士生,你有什么建议?

靖世:建议就是如果找工作的话,可以尝试一下研究跟应用结合得比较好的地方,或许未来的发展空间会更广泛。在未来的工作上,希望他们一样要有坚韧跟坚持的精神,要能够去渡过一些临时的挫折,长期保持钻研跟创新的精神。要能脚踏实地,能沉得住气,能够坚持跟坚韧,但是内心又要保持追求卓越的精神。

提问:如果让你给阿里的博士生招聘打个广告,你会怎么说?

靖世:阿里巴巴其实可以说是一个数据公司,我们在数据搜集、数据应用方面持续投入了非常大的资源。因为我们的业务涉及了人们工作和生活的方方面面,这些业务每天都在产生大量数据。

我们其实拥有着世界上最大的数据场景,我们还有世界最大的market place。了解机器学习和人工智能的人都知道,一个是数据,数据决定了特征或者你怎么玩;一个是market place,里面很多点其实是Label。所以在数据跟目标两方面,都比较全的是阿里巴巴。

而这些数据的价值发挥,需要仰仗背后的算法跟人工智能,而每个方面的数据的价值,如果发挥出来,可以推动社会方方面面的进步,这里面的舞台和空间是巨大的。


来源:阿里巴巴招聘
原文链接

时间: 2024-10-29 07:58:15

AI大咖专访丨阿里靖世:博士的研究同样可以在工业界做,更可以影响亿万人的生活!的相关文章

大咖 | 从Ian Goodfellow到Yann LeCun,对话Quora AI大佬TOP 10

与AI大咖对话,是不是听起来就很激动呢? 在人工智能.数据科学领域,学术与行业的发展瞬息万变,成果频出,通过二手资料了解这一领域似乎已远远不够.如果有机会,当然还是要紧跟大咖们的步伐呀~ 那么,人工智能.数据科学领域的大咖到底在哪里?文摘菌悄悄告诉你,他们可都在国外知名问答论坛Quora上等着你呢!从GAN之父Ian Goodfellow,到CNN之父Yann LeCun,你都能在Quora上找到他们的身影. 今天,文摘菌就将为你盘点Quora上人工智能.数据科学领域的10位大咖,并为每位大咖精

阿里CTO王坚:云计算将影响每个人生活

11月19日,首届世界互联网大会在浙江乌镇开幕,在下午进行的"透过浙江看中国--信息经济论坛"上,阿里巴巴集团CTO王坚表示,云计算正在显现出生态的力量. 王坚说,云计算平台的价值在于,云上的企业能为社会带来更大的机会.他表示,互联网改变了产业的形态.在云计算时代,每个人的生活都会受到影响.云栖小镇物理上是在杭州转塘,但是实际上,因为互联网,使得全球的创业者能够结合在一起,因为云计算,可以让理想平等.使得几个人和几万个人的企业站到了同一条起跑线上. 王坚特别提到了一个在新疆库尔勒通过云

阿里大咖谈工程师成长:主动承担责任,才有大进步(视频)

这是架构师最好的时代.物联网.移动.云计算.大数据.人工智能等新技术在行业的深入应用不断驱动着企业IT系统的变迁.作为系统的灵魂,架构师的思想.设计.技能和经验,影响深远. 同时,我们也为您奉上一段精彩视频--数位阿里技术大咖分享他们个人的成长经历,他们的思考,或许对你有所启发. 部分专家简介: 蒋晓伟,阿里搜索事业部资深搜索专家,蒋晓伟2014年底加入阿里,现在负责搜索工程的数据团队.在加入阿里前曾经就职于西雅图的脸书.负责过调度系统,Timeline Infra和Messenger的项目.在

技术大咖齐亮相:与阿里云共贺新春(视频)

随着新年钟声的敲响,2016年已经离我们渐行渐远,2017年已经来到我们身边,金鸡报晓,恭贺新春!值此新春佳节之际,阿里云携数十位技术大咖给大家拜年了! 梨视频技术总监,刘隽 梨视频从上云的第一天开始就使用阿里云的全平台服务,并且是阿里云最早的一批大数据平台使用者,在接下来的一年里,希望梨视频在阿里云强大的技术支持下获得更快速的发展. 雪球网技术总监,王栋 雪球网在2015年初开始上云,目前有80%的流量来自于阿里云,阿里云帮助雪球网解决了很多扩展性的问题,在安全防护上,阿里云也为雪球网提供了高

D-News大数据新闻Top10|阿里财报公布 AI领域新动态

◆ ◆ ◆ 行业动态 "十三五"国家科技创新规划发布 8月8日,经李克强总理签批,国务院近日印发<"十三五"国家科技创新规划>(以下简称<规划>),明确提出了未来五年国家科技创新的指导思想.总体要求.战略任务和改革举措.<规划>提出,将研发智慧城市公共服务一体化运营平台,开展新型智慧城市群的集中应用创新示范.重点推进5G(第五代移动通信网络)技术标准和商用应用网络.突破大数据共性关键技术,建成全国范围内数据开放共享的标准体系和交换

深度丨中科院田捷博士:基于医疗大数据和AI技术的影像组学及其应用丨CCF-GAIR 2017

7月9日,在由中国计算机学会(CCF)主办,雷锋网.香港中文大学(深圳)联合承办的CCF-GAIR 全球人工智能与机器人峰会的第三天,在未来医疗专场上,田捷博士做了"基于医疗大数据和人工智能的影像组学及其应用"的主题演讲. 田捷博士,是中国科学院自动化研究所研究员.Fellow of IEEE,SPIE,IAMBE,AIMBE,IAPR.其主要从事医学影像分析与生物特征识别的研究和应用的工作.田捷博士的很多学术论文.研究成果,均可见自国内外的各学术杂志和学术会议上,学术论文达上百篇.

阿里星专访丨星罡:因为期待,你需要更出色!

施晓罡,花名星罡. 阿里巴巴算法工程师,2016届阿里星. 2016年,星罡在北京大学毕业并获得了博士学位,研究课题为<动态数据流上的实时迭代计算>. 博士期间,他是一位名副其实的学霸,作为一名学生,在学术上取得了令人瞩目的成绩,曾在包括SIGMOD和TODS在内的顶级国际期刊和会议上发表多篇学术论文,并获得校长奖学金.五四奖学金等诸多荣誉和奖励,其中校长奖学金是北大的最高奖学金. 2016年毕业加入阿里之后,参与了实时计算系统Blink的开发工作,负责计算状态的存储.备份和恢复等功能的研发.

GBDC丨这些大咖带着干货来了,你打算带着什么来?

大数据.云计算.物联网等新技术.新产业.新理念的到来,正加速革新传统的产业模式,打破原有的产业链,开创新型的产业发展模式,颠覆以往的传统观念.数 据成为产业的中心,数据的获取和应用成为全新命题,ICT与DT(信息通信技术+数据技术)的融合终将会引爆一个新的时代. 2016年1月20日,由全球大数据联盟GBDC.全球移动游戏联盟GMGC.世界O2O组织.光合资本主办,中国互联网协会(ISC)O2O 工作组支持的2016全球大数据峰会GBDC2016,将在国家会议中心盛大举行.国家物联网标识管理公共

大咖|第四范式蒋仁皓:什么才是构建企业AI的关键要素

或许在我们想象中人工智能已经如星火燎原般迅速蔓延到各种行业.场景里面取代或者帮助人提升一些业务价值了,但事实到底是否如此?在落地中,什么才是构建企业AI的关键要素? 11月30日,清数大数据产业联盟与清华校友总会AI大数据专委会(筹)共同主办的金融大数据行业思享会上,第四范式咨询副总监蒋仁皓分享了金融行业构建AI核心能力的实践.蒋仁皓重点介绍基于学习圈的金融业务的AI核心能力构建方法,来自中国银行.包商银行.电信公司.微软公司等相关业务领域近30余位业内人士参与交流和讨论. AI到底是什么?我们