专访刘昕博士：深度学习与人工智能

刘昕，博士毕业于中国科学院计算技术研究所，师从山世光研究员。博士阶段主要从事人脸识别与深度学习技术的研究与工业化应用，作为第一主力或并列第一主力获得ICCV 2015 年龄估计竞赛亚军、ICCV 2015 文化事件识别竞赛冠军和 2015 年度阿里巴巴天池大规模图像检索竞赛总决赛冠军。2016年8月起，担任人工智能初创公司中科视拓公司CEO，并先后获得两轮投资，投资人包括线性资本、紫牛基金、明势资本和安赐资本。

ArchData技术峰会将于9月9日上海徐汇区田林路COCOSPACE开幕，在大会之前，中生代技术特邀专家记者王公仆对刘昕博士做了会前访谈

王公仆：刘博您好，首先感谢您花费宝贵的时间来参加ArchData峰会，给大家分享深度学习理论与人脸识别应用相关的技术话题，正式会议前，我这里有一些问题想请教您：

王公仆：您的博士生导师山世光先生是人脸识别领域的国内知名研究员，你们所在实验室也是国内最早开展人脸识别研究的单位，从97年至今来一直在从事计算机视觉领域相关研究，请问当初是什么样的动机让您们从科研院所走出来创业的呢？

刘昕博士：主要原因有两个。其一是大环境鼓励科研人员走出去，加速科研成果的转化。其二是我们希望能通过走出来创业，获得资金和数据上更大的支持，更好的实现计算所要求的“科研为国分忧，创新与民造福”。

王公仆：请问在人工智能计算机视觉领域创业火热的当下，中科视拓将如何与商汤科技，Face++，驭势科技等企业竞争呢？

刘昕博士：事实上，计算机视觉领域有一块很大的蛋糕，可以落地的场景非常多，比如人脸识别技术可以应用在安防、金融、实名制上，通用视觉识别技术可以应用在无人驾驶、无人机视觉中。今天计算机视觉技术还处在快速发展阶段，存在不少技术上的盲区，因此市场的想象空间还无比巨大，远远未达到存量市场的竞争阶段，因此不同的创业公司事实上是在相互协作，共同探索计算机视觉技术的未来。

王公仆：作为深度学习专家，您对人脸识别技术的成熟度是怎么看待的呢？典型的应用场景会有哪些？

刘昕博士：人脸识别的成熟度在不同应用场景下差别很大。目前比较成熟的应用场景包括1:1条件下的人证实名制比对，例如中科视拓的人证比对一体机，已经在公证处、运营商营业厅、机场火车站实名验票等领域获得成功应用。再比如1：N（N<1万）场景下室内半配合环境的无卡考勤与门禁系统，高清证件照条件下的大库检索系统等。相对来说成熟度不足的有1：N（N>1亿）条件下的刷脸支付，无配合的监控条件下动态人脸识别等。

王公仆：之前我曾在安防龙头企业海康威视工作过2年，深知安防产业数据存储的压力，尤其高清摄像头拍摄的画面，在计算机视觉技术逐渐成熟之后，它会给安防行业带来哪些实质性的价值呢？

刘昕博士：海量的数据会带来很多方面的价值，比如对于深度学习而言，海量的数据加上人工的标注是实现智能的基础。再比如，海量的视频数据也使得智能交通、人脸黑名单监控、车辆行人的轨迹追踪等计算机视觉应用拥有了基础条件。

王公仆：您曾经作为第一主力或并列第一主力获得 ICCV 2015 年龄估计竞赛亚军、ICCV 2015 文化事件识别竞赛冠军和 2015 年度阿里巴巴天池大规模图像检索竞赛总决赛冠军，能分享下团队取得这么优秀的成绩的经验吗？

刘昕博士：在实践中我们获取了很多经验，在这里给大家分享其中三个：
首先，要有足量的训练数据，利用海量的训练数据和迁移学习技术，我们可以在竞赛的小数据集上获得更好的模型精度。
其次，需要有算法创新的能力，例如我们在阿里巴巴天池大规模图像检索比赛中就使用了标签噪声鲁棒的新学习算法。
最后，需要有足够的算力支撑，对于一个竞赛而言，拥有足够的GPU也是快速迭代算法和模型的基础。

王公仆：您作为中科视拓CEO，还担任着深度学习大讲堂微信公众号的执行总编乐于给大家分享技术知识，请问对于非机器学习的研发工程师该如何学习成长从而进阶成为一个机器学习工程师呢？

刘昕博士：我的建议主要有三个：
第一点，重新找回对数学的感觉，这里面高等数学、线性代数和凸优化是必须掌握的数学知识。
第二点，熟悉至少一种深度学习框架，作为工业界使用，推荐Tensorflow，MXNet和PyTorch。
第三点，瞄准一个领域，比如计算机视觉，语音识别或自然语言处理。中科视拓在实习生培养和新员工培训中，也主要围绕这三个方面展开。

王公仆：目前机器学习和深度学习都有许多框架，在这些框架的选择方面您有什么经验和建议给到初学者？

刘昕博士：事实上，随大流一般不会有错，因为社区的繁荣与否往往决定了入门和深入的难度。有Python背景的工程师可以很快上手Tensorflow，MXNet，PyTorch这样上层基于Python的深度学习框架。这里特别推荐一下中科视拓的实习算法研究员潘汀（同时也是中科院计算所的博士生）主导开发的Dragon框架，通过独创的虚拟化框架技术，实现了对不同框架的统一调用。

王公仆：一个人工智能项目需要在软件算法，硬件算力和大数据积累等三个层面优化，产品才能有最好的表现，能给我们分享下你们的人脸识别相关产品在这三个层面的积累或优势吗？

刘昕博士：从算法上，我们在小数据深度学习、脏乱差数据深度学习和零数据深度学习方面都有着自己独创的技术，我们称之为X数据驱动的深度学习技术。在算力方面，中科视拓也构建了一个大规模的GPU计算集群。在数据方面，中科视拓拥有千万人规模，数以亿计的人脸数据和数以千万计的车辆、行人和无人机视觉数据。

王公仆：随着人工智能的持续火热，也引起了一些专家对未来智能机器人的担忧，比如最近埃隆·马斯克联合百名人工智能专家呼吁联合国立法禁止机器人武器，您对人工智能未来的发展怎么看，会出现失控的可能吗？

刘昕博士：我认为人工智能未来可期，但现状还远达不到人工智能威胁论乃至失控的地步。机器依旧依赖于人类的导师信号进行学习，依赖于繁琐和数学机制不明确的调参来找到次优解，以及存在难以解释的实际场景下的bad case。机器依旧是傻傻的依赖于人类智慧来迭代与进步，所以短时间还不会失控。

中生代记者：如何看待AI取代人这个话题？

刘昕博士：在可以预见的10年中，AI将深度的参与到金融、教育、法律、财务、医疗、公共安全等行业，一部分取代人的工作。我自己的一个亲身经历，现在高考志愿填报的时候，准大学生们最关心的是自己所选的专业在毕业后会不会被AI替代。

中生代记者：本次大会的内容，能不能剧透下分享内容？

刘昕博士：本次大会我将首先介绍深度学习的基本概念、基础理论和方法。从历史的视角回顾深度学习的两起三落。最后介绍中科视拓深度学习调参机器人AutoCNN的相关实践经验。

最后感谢您接受采访，谢谢。

时间： 2024-08-02 18:13:46

专访刘昕博士：深度学习与人工智能

专访刘昕博士：深度学习与人工智能的相关文章

吴恩达 NIPS 2016：利用深度学习开发人工智能应用的基本要点（含唯一的中文版PPT）

Yann LeCun清华演讲：讲述深度学习与人工智能的未来

图像识别、深度学习、人工智能成了一线大公司要拿下的战略要地

专访 | 清华大学朱军：深度学习“盛行”，传统方法何去何从？

2016深度学习统治人工智能？深度学习十大框架

深度学习帮助人工智能走得更远

AI科技评论专访Yann LeCun: 关于深度学习未来的14个问题

深度学习：人工智能在自动驾驶中的核心应用

专访 | 杨强教授谈CCAI、深度学习泡沫与人工智能入门