专访刘昕博士:深度学习与人工智能

刘昕,博士毕业于中国科学院计算技术研究所,师从山世光研究员。博士阶段主要从事人脸识别与深度学习技术的研究与工业化应用,作为第一主力或并列第一主力获得ICCV 2015 年龄估计竞赛亚军、ICCV 2015 文化事件识别竞赛冠军和 2015 年度阿里巴巴天池大规模图像检索竞赛总决赛冠军。2016年8月起,担任人工智能初创公司中科视拓公司CEO,并先后获得两轮投资,投资人包括线性资本、紫牛基金、明势资本和安赐资本。

ArchData技术峰会将于9月9日上海徐汇区田林路COCOSPACE开幕,在大会之前,中生代技术特邀专家记者王公仆对刘昕博士做了会前访谈

王公仆:刘博您好,首先感谢您花费宝贵的时间来参加ArchData峰会,给大家分享深度学习理论与人脸识别应用相关的技术话题,正式会议前,我这里有一些问题想请教您:

王公仆:您的博士生导师山世光先生是人脸识别领域的国内知名研究员,你们所在实验室也是国内最早开展人脸识别研究的单位,从97年至今来一直在从事计算机视觉领域相关研究,请问当初是什么样的动机让您们从科研院所走出来创业的呢?

刘昕博士:主要原因有两个。其一是大环境鼓励科研人员走出去,加速科研成果的转化。其二是我们希望能通过走出来创业,获得资金和数据上更大的支持,更好的实现计算所要求的“科研为国分忧,创新与民造福”。

王公仆:请问在人工智能计算机视觉领域创业火热的当下,中科视拓将如何与商汤科技,Face++,驭势科技等企业竞争呢?

刘昕博士:事实上,计算机视觉领域有一块很大的蛋糕,可以落地的场景非常多,比如人脸识别技术可以应用在安防、金融、实名制上,通用视觉识别技术可以应用在无人驾驶、无人机视觉中。今天计算机视觉技术还处在快速发展阶段,存在不少技术上的盲区,因此市场的想象空间还无比巨大,远远未达到存量市场的竞争阶段,因此不同的创业公司事实上是在相互协作,共同探索计算机视觉技术的未来。

王公仆:作为深度学习专家,您对人脸识别技术的成熟度是怎么看待的呢?典型的应用场景会有哪些?

刘昕博士:人脸识别的成熟度在不同应用场景下差别很大。目前比较成熟的应用场景包括1:1条件下的人证实名制比对,例如中科视拓的人证比对一体机,已经在公证处、运营商营业厅、机场火车站实名验票等领域获得成功应用。再比如1:N(N<1万)场景下室内半配合环境的无卡考勤与门禁系统,高清证件照条件下的大库检索系统等。相对来说成熟度不足的有1:N(N>1亿)条件下的刷脸支付,无配合的监控条件下动态人脸识别等。

王公仆:之前我曾在安防龙头企业海康威视工作过2年,深知安防产业数据存储的压力,尤其高清摄像头拍摄的画面,在计算机视觉技术逐渐成熟之后,它会给安防行业带来哪些实质性的价值呢?

刘昕博士:海量的数据会带来很多方面的价值,比如对于深度学习而言,海量的数据加上人工的标注是实现智能的基础。再比如,海量的视频数据也使得智能交通、人脸黑名单监控、车辆行人的轨迹追踪等计算机视觉应用拥有了基础条件。

王公仆:您曾经作为第一主力或并列第一主力获得 ICCV 2015 年龄估计竞赛亚军、ICCV 2015 文化事件识别竞赛冠军和 2015 年度阿里巴巴天池大规模图像检索竞赛总决赛冠军,能分享下团队取得这么优秀的成绩的经验吗?

刘昕博士:在实践中我们获取了很多经验,在这里给大家分享其中三个:
首先,要有足量的训练数据,利用海量的训练数据和迁移学习技术,我们可以在竞赛的小数据集上获得更好的模型精度。
其次,需要有算法创新的能力,例如我们在阿里巴巴天池大规模图像检索比赛中就使用了标签噪声鲁棒的新学习算法。
最后,需要有足够的算力支撑,对于一个竞赛而言,拥有足够的GPU也是快速迭代算法和模型的基础。

王公仆:您作为中科视拓CEO,还担任着深度学习大讲堂微信公众号的执行总编乐于给大家分享技术知识,请问对于非机器学习的研发工程师该如何学习成长从而进阶成为一个机器学习工程师呢?

刘昕博士:我的建议主要有三个:
第一点,重新找回对数学的感觉,这里面高等数学、线性代数和凸优化是必须掌握的数学知识。
第二点,熟悉至少一种深度学习框架,作为工业界使用,推荐Tensorflow,MXNet和PyTorch。
第三点,瞄准一个领域,比如计算机视觉,语音识别或自然语言处理。中科视拓在实习生培养和新员工培训中,也主要围绕这三个方面展开。

王公仆:目前机器学习和深度学习都有许多框架,在这些框架的选择方面您有什么经验和建议给到初学者?

刘昕博士:事实上,随大流一般不会有错,因为社区的繁荣与否往往决定了入门和深入的难度。有Python背景的工程师可以很快上手Tensorflow,MXNet,PyTorch这样上层基于Python的深度学习框架。这里特别推荐一下中科视拓的实习算法研究员潘汀(同时也是中科院计算所的博士生)主导开发的Dragon框架,通过独创的虚拟化框架技术,实现了对不同框架的统一调用。

王公仆:一个人工智能项目需要在软件算法,硬件算力和大数据积累等三个层面优化,产品才能有最好的表现,能给我们分享下你们的人脸识别相关产品在这三个层面的积累或优势吗?

刘昕博士:从算法上,我们在小数据深度学习、脏乱差数据深度学习和零数据深度学习方面都有着自己独创的技术,我们称之为X数据驱动的深度学习技术。在算力方面,中科视拓也构建了一个大规模的GPU计算集群。在数据方面,中科视拓拥有千万人规模,数以亿计的人脸数据和数以千万计的车辆、行人和无人机视觉数据。

王公仆:随着人工智能的持续火热,也引起了一些专家对未来智能机器人的担忧,比如最近埃隆·马斯克联合百名人工智能专家呼吁联合国立法禁止机器人武器,您对人工智能未来的发展怎么看,会出现失控的可能吗?

刘昕博士:我认为人工智能未来可期,但现状还远达不到人工智能威胁论乃至失控的地步。机器依旧依赖于人类的导师信号进行学习,依赖于繁琐和数学机制不明确的调参来找到次优解,以及存在难以解释的实际场景下的bad case。机器依旧是傻傻的依赖于人类智慧来迭代与进步,所以短时间还不会失控。

中生代记者:如何看待AI取代人这个话题?

刘昕博士:在可以预见的10年中,AI将深度的参与到金融、教育、法律、财务、医疗、公共安全等行业,一部分取代人的工作。我自己的一个亲身经历,现在高考志愿填报的时候,准大学生们最关心的是自己所选的专业在毕业后会不会被AI替代。

中生代记者:本次大会的内容,能不能剧透下分享内容?

刘昕博士:本次大会我将首先介绍深度学习的基本概念、基础理论和方法。从历史的视角回顾深度学习的两起三落。最后介绍中科视拓深度学习调参机器人AutoCNN的相关实践经验。

最后感谢您接受采访,谢谢。

时间: 2024-08-02 18:13:46

专访刘昕博士:深度学习与人工智能的相关文章

吴恩达 NIPS 2016:利用深度学习开发人工智能应用的基本要点(含唯一的中文版PPT)

雷锋网按:为了方便读者学习和收藏,雷锋网(公众号:雷锋网)特地把吴恩达教授在NIPS 2016大会中的PPT做为中文版,由三川和亚峰联合编译并制作. 今日,在第 30 届神经信息处理系统大会(NIPS 2016)中,百度首席科学家吴恩达教授发表演讲:<利用深度学习开发人工智能应用的基本要点(Nuts and Bolts of Building Applications using Deep Learning)>. 此外,吴恩达教授曾在今年 9 月 24/25 日也发表过同为<Nuts a

Yann LeCun清华演讲:讲述深度学习与人工智能的未来

半个月前,Yann LeCun要来清华演讲的消息在国内AI圈一经传开,各位AI界人士便坐不住了.作为Facebook人工智能研究院院长.纽约大学终身教授.卷积神经网络之父,LeCun已然成为了AI人心目中的男神. 演讲当天(3月22日),雷锋网(公众号:雷锋网)也来到了LeCun的演讲现场.演讲开始前,只见许多想要听演讲,却无奈没有得到票的同学,焦急地坚守在演讲大厅门前,希望能一睹男神风采,或运气爆棚能偶得一票.一个专业性质极强的学术演讲能吸引这么多人来参加,也再一次体现了Yann LeCun的

图像识别、深度学习、人工智能成了一线大公司要拿下的战略要地

摘要: 随着读图时代的到来,大量的内容产生在图片和视频上,对图片的识别.理解和分析需求越来越强烈.一时间,图像识别.深度学习.人工智能成了一线大公司要拿下的战略要地,百度 随着读图时代的到来,大量的内容产生在图片和视频上,对图片的识别.理解和分析需求越来越强烈.一时间,图像识别.深度学习.人工智能成了一线大公司要拿下的战略要地,百度有深度学习研究院,阿里也把<大数据>和<数据之巅>的作者徐子沛挖来任副总裁布局数据挖掘.对一般公司来说,它们往往没有人工智能方面的工程和技术能力,但又有

专访 | 清华大学朱军:深度学习“盛行”,传统方法何去何从?

朱军博士是清华大学计算机系长聘副教授.智能技术与系统国家重点实验室副主任.卡内基梅隆大学兼职教授.2013年,入选IEEE Intelligent Systems的"人工智能10大新星"(AI's 10 to Watch).他主要从事机器学习研究,在国际重要期刊与会议发表学术论文80余篇.担任国际期刊IEEE TPAMI和Artificial Intelligence的编委.国际会议ICML 2014地区联合主席.以及ICML.NIPS等国际会议的领域主席. 清华大学计算机系长聘副教授

2016深度学习统治人工智能?深度学习十大框架

2015 年结束了,是时候看看 2016 年的技术趋势,尤其是关于深度学习方面.新智元在 2015 年底发过一篇文章<深度学习会让机器学习工程师失业吗?>,引起很大的反响.的确,过去一年的时间里,深度学习正在改变越来越多的人工智能领域.Google DeepMind 工程师 Jack Rae 预测说,过去被视为对于中型到大型数据集来说最佳的预测算法的那些模型(比如说提升决策树(Boosted Decision Trees)和随机森林)将会变得无人问津. 深度学习,或者更宽泛地说--使用联结主义

深度学习帮助人工智能走得更远

说深度学习就不得不提Geoffrey Hinton.一.Geoffrey Hinton是何许人?Geoffrey Hinton是Deep Learning(深度学习)方面的领军人物,是世界上机器学习与人工智能领域杰出研究者之一.Geoffrey Hinton是英国http://www.aliyun.com/zixun/aggregation/13592.html">剑桥大学实验心理学学位获得者,后来获得人工智能博士学位,他同时也是伦敦大学Gatsby神经计算科学部门的创始董事.他研究利用神

AI科技评论专访Yann LeCun: 关于深度学习未来的14个问题

"ICLR算是一个必须的选择吧,因为其实没有很多的选择.所以从1996或者1997年以后,我组织了一个工作室,学习工作室,每年大概只有八九十人参加.到了2006.2007年,深度学习的大潮来临的时候,这个工作室增长得很快,我们觉得需要有一个深度学习方面的会议,所以我们就在4年前的时候把这个邀请制的工作室变成了开放式的会议.我觉得这个决定非常棒,每年都吸引了很多参加者.今年1100人,去年500多人,前年两三百人,第一年的时候130人,所以本质上它发展得也很快." 4月23-26日,IC

深度学习:人工智能在自动驾驶中的核心应用

从始于60年代的<星际迷航>系列,再到<钢铁侠>系列.<I, robot>以及黑客帝国等等,人工智能在多数公众面前的呈现多多少少都有些科幻成分.不过近些年,人工智能技术在现实生活中的飞速发展使得公众的关注点明显聚焦在了技术产业中. 去年,AlphaGo以4:1赢下李世石的世纪大战在让2016年成为人工智能元年的同时,也让公众对人工智能在现实场景中的应用有了更多的期待.事实上,上述场景早在50年代便已有了相关的实践.1959年,美国研究者Samuel便设计了一个下棋程序,

专访 | 杨强教授谈CCAI、深度学习泡沫与人工智能入门

7 月 22 - 23 日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁金服主办,CSDN.中国科学院自动化研究所承办,作为独家直播合作伙伴的第三届中国人工智能大会(CCAI 2017)将在杭州国际会议中心盛大开幕. 作为大会主席,香港科技大学计算机与工程系主任.AAAI Fellow 杨强教授最近接受了大会记者专访.这次访谈干货满满,其中有不少话题是杨强教授首度公开谈及,比如下一个 AI 突破口.深度学习泡沫.AI 之路心得.本科生入门 AI.好学生要能教导师学习,等等. (点击阅读杨强教授历史