【专访】KDD2018主席熊辉教授:数据挖掘与深度学习结合新趋势

2017年8月13日至17日,数据挖掘国际顶级学术会议 KDD2017在加拿大哈利法克斯市举行。本次大会总的注册人数达到1656人,来自全世界51个国家和地区。其中,美国注册人数最多,其次是中国,第三是加拿大。

关于本次大会论文接受数据、中国学者和公司的表现以及最佳论文、最佳论文请参见新智元此前的报道《【KDD最佳论文出炉】BAT、华为谷歌论文排行榜,中国包揽KDDCUP》。

大会同时宣布了KDD2018年大会的主席名单。美国罗格斯-新泽西州立大学信息安全中心主任、罗格斯商学院管理科学与信息系统系熊辉当选 Research Track PC 主席。

熊辉 E- Mail:hxiong@rutgers.edu ;实验室主页:http://datamining.rutgers.edu

熊辉教授本科毕业于中国科学技术大学,博士毕业于美国明尼苏达大学,目前为美国罗格斯-新泽西州立大学信息安全中心主任、罗格斯商学院管理科学与信息系统系副系主任、正教授 (终身教授)、RBS院长讲席教授,并担任中国科学技术大学大师讲席教授。

熊辉教授主要研究领域涵盖数据挖掘、大数据、人工智能;获得的部分荣誉包括ACM杰出科学家,长江讲座教授,海外杰青B类(海外及港澳学者合作研究基金)。熊辉教授的研究工作被Forbes, The Economist,Harvard Business Review,The Wall Street Journal等媒体广泛报道。其中,经济学人杂志(The Economist)在2016年专文重点介绍了熊辉教授利用大数据技术预防犯罪的研究工作 (Economist Article Title: Cutpurse capers),同时哈佛商业评论在2016年也以专文重点介绍他的关于人力大数据分析的前沿工作。

KDD高产学者:今年被接收文章有8篇;中国学者学术地位大幅提升

据介绍,本次大会熊辉教授和团队总共有8篇文章被接收(包括oral),去年他们团队的论文被接收数量是9篇,可谓非常高产。要知道,相比之下,在本年度KDD接收的 200 多篇论文里,来自中国大陆的高校和企业只有 20 多篇。

另外,本届KDD上 China Chapter,熊辉教授与裴健、郑宇和叶杰平等多位顶尖的学者一起组织了精彩的分享。


熊辉对新智元介绍说:“在本届KDD China Session, 我介绍了在大数据人才智能化分析这一世界前沿领域的创新工作。区别于传统人力资源管理须通过大量长期实践才能总结出经验规则,永远在解决问题,管理相对滞后。大数据人才智能化管理通过数据挖掘提供客观性,完整性,透明性,预测性分析,可以让管理做到更加客观,公正,未雨绸缪。具体来说,我从人才、组织和文化三大人才管理业务场景出发,介绍了一整套针对业务痛点的智能化人才管理工具和解决方案,所介绍的人才智库系统是基于我们自主开发的数十项智能化机器学习模型算法工具,有效支持和辅助了人才获取、人才保留、人才发掘、组织稳定等一整套管理动作。我们构建的这套完整的智能化人才管理系统,充分展示了以大数据驱动智能化人才管理的高效性,在世界范围内尚属首创。”

近年来,中国学者在KDD学术会议上的存在感逐渐变强,表现非常突出。对此,熊辉教授也有感受,他说:“中国学者这几年在各个研究方向都在快速成长和突破。我具体感觉体现在两个方面。首先是大量高水平的论文发表,并伴生大批的优秀青年学者;其次是中国学者学术地位的大幅提升,越来越多的中国学者担任行业顶级会议的组织者和顶级期刊的编委甚至主编。”

今年论文接受率最高只有12.8%, 为什么KDD的论文录取率那么低?

数据显示,今年KDD研究Track共审阅了748篇论文,共接收130篇,其中口头展示64篇,海报展示66篇,接收率分别为8.6%和8.8%。数据科学应用Track 共审阅了390篇论文,共接收86篇,其中口头展示36篇,海报展示50篇,接收率分别为9.2%和12.8%。

KDD向来以论文接受率低著称。被问及大会接受率为何如此低,熊辉教授向新智元介绍说,KDD是数据挖掘和数据科学领域最顶级的学术年会。来自学术界,工业界和政府部门的研究人员都希望在KDD上发表和展示自己的有影响力的工作,因而投稿量每年都特别大,所以KDD的接收率一直非常低。另外,非常多的高科技公司人力资源部门都积极招聘在KDD以第一作者发表过论文的学生,所以学生也都非常有投稿热情,这也客观导致文章接受率低。 

KDD新趋势:传统行业与大数据,机器学习,人工智能技术的结合将会成为一个新的战场和制高点

新智元在采访中问到,近两年KDD领域最值得关注的趋势是什么?

熊辉教授认为,近两年,数据挖掘,机器学习和人工智能技术,不仅仅和新兴互联网产业结合紧密,和传统产业的相互结合和促进,也成为了一个新亮点。比如,根据人们传统的理解,人力资源行业是一个组织行为学科,是很难被量化的。我们的人才智能化的项目展示了通过大数据分析提供客观性,完整性,透明性,预测性分析,可以让管理做到更加客观,公正,未雨绸缪。又比如,工业制造行业,似乎也是很难拥抱大数据和人工智能技术。但是,在工业制造4.0的标准里,人工智能技术,将会成为传统工业制造涅槃重生的引擎。他说:“我相信传统行业与大数据,机器学习,人工智能技术的结合将会成为一个新的战场和制高点。”

那么,近年来,KDD领域向机器学习和实际应用的结合非常紧密,这是一个大趋势么?

熊辉教授认为这是一个大趋势。他进一步解释说,首先人类在世界任何一个角落,任何一个时间,任何一类的行为,都以不同数据的形式开始保存了下来。在人类历史上,我们从来没有这么好的机会能够通过细致化,全面化的数据,深入毛孔的了解人的行为,发现行业的痛点。所以,未来KDD领域向机器学习和实际应用的结合会越来越紧密,而且未来越来越多KDD的研究问题会来源于应用实践。

具体到深度学习。熊辉教授认为,大数据+深度学习,目前是很多领域的非常热门的一类技术解决方案。深度学习在拥有大数据的很多应用领域展示了自己独特的优势,比如语音识别和图像处理。然而,他的个人观点是,深度学习就像任何一种技术都有它的局限性,也有它的适用范围。在KDD领域,他相信会有很多研究专注于深度学习的参数选择,降低计算复杂度和结果的可解释性。

数据挖掘高手谈数据:什么样的数据才是好数据?

作为在数据挖掘领域有着深厚积累的资深教授。熊辉教授如何看待数据?怎么样的数据才能是好数据?要怎样获得这些好数据呢?

熊辉教授认为,要获得高效优质的数据,我认为应该同时考虑“量”和“质”。 量,不仅仅是指数据量的大,还包括是否有效覆盖所要研究课题的不同的对象,即统计里的population;“质”指的是数据信息的有效性,即我们的数据的噪声程度,是否包括具体问题分析所需的各种属性,是否存在和易于构建内在的关联性,是否能有表征丰富的语义,是否能够支持快速计算和分析。 

对于大数据。他认为,数据不是简单的越大越好,而是和需要解决的问题相关的数据越大越好。在很多具体数据分析应用,特别是商务智能中,还要注意大数据和小数据的有效结合。

 

AI的迅速发展也为数据挖掘领域带来了一些有趣的变化,比如数据的发现和挖掘的自动化,就是由机器来自动完成数据挖掘的工作。针对这一研究方向,熊辉教授向新智元介绍说:“在学术界,已经有一些学者开始尝试探索自动化的数据挖掘,一个潜在方向是Prescriptive Analysis。”

比如,他们和IBM的学者合作尝试实现自动化的异常点检测,在今年KDD17发表了文章 “REMIX: Automated Exploration for Interactive Outlier Detection”。但是,基于数据挖掘工作本身的多样性和复杂性,往往需要领域知识和技术知识的有机结合,经常很难完全避免人的参与,所以做到完全自动化在目前看还是不现实的。


挖掘数据的价值:抓小偷,治雾霾甚至反恐

2015年开始,数据挖掘领域出现了一些非常有意思的研究,比如熊辉教授做的利用大数据分析“抓小偷”的研究(参见新智元的报道:KDD 精彩论文:用智能公交一卡通数据抓小偷)。

另外,也有研究员在探索使用数据挖掘进行雾霾的治理和反恐。熊辉教授对新智元说,随着传感网技术的快速发展和实施,越来越密集的传感器可以帮助实时搜集广泛覆盖的环境监测的数据。这些数据对于我们有效判断雾霾的成因,进而帮助合理的雾霾治理提供了决策支持。

在反恐领域,数据挖掘应用前景广阔。首先,近几年数据分析技术和大数据硬件分析平台技术获得突破性进步。比如,云计算大数据分析平台的快速发展和应用,以及深度学习技术在文本,声音,图像,视频数据的分析取得了很大成功。其次,现在可运用于反恐的数据来源多样化和数据覆盖范围也更广阔。例如,广泛分布的摄像头已经一定程度上物联网了,联网的摄像头产生的多源视频数据可以很好的帮助发掘潜在恐怖袭击,或者帮助捕获恐怖分子。

文章转自新智元公众号,原文链接

时间: 2024-10-10 19:15:10

【专访】KDD2018主席熊辉教授:数据挖掘与深度学习结合新趋势的相关文章

机器学习如何选择模型 & 机器学习与数据挖掘区别 & 深度学习科普

今天看到这篇文章里面提到如何选择模型,觉得非常好,单独写在这里.    更多的机器学习实战可以看这篇文章:http://www.cnblogs.com/charlesblc/p/6159187.html   另外关于机器学习与数据挖掘的区别, 参考这篇文章:https://www.zhihu.com/question/30557267 数据挖掘:也就是data mining,是一个很宽泛的概念.字面意思就是从成吨的数据里面挖掘有用的信息.这个工作BI(商业智能)可以做,数据分析可以做,甚至市场运

CCAI 2017 | 专访德国语言技术领军者 Hans Uszkoreit:深度学习还不足以解决 NLP 核心问题

会前,我们采访到了大会 Keynote 嘉宾.德国人工智能研究中心科技总监 Hans Uszkoreit 博士. Uszkoreit 博士是中德两国人工智能合作的核心人物,负责德国人工智能研究中心在中国的所有合作项目,今年 3 月,他刚被任命为在北京新成立的人工智能技术中心(AITC)总监兼首席科学家.在访谈中,Uszkoreit 博士谈到了人工智能在工业 4.0 和商业智能上的应用,以及中.美.欧在人工智能领域的差异. 对于他的老本行,Uszkoreit 博士认为,语言技术是人工智能的核心部分

【深度学习框架大PK】褚晓文教授:五大深度学习框架三类神经网络全面测评(23PPT)

香港浸会大学褚晓文教授团队在2016年推出深度学习工具评测的研究报告,并在2017年年初发布更新,引起广泛关注.见新智元报道< 基准评测 TensorFlow.Caffe.CNTK.MXNet.Torch 在三类流行深度神经网络上的表现(论文)>,2017年初版本的评测的主要发现可概括如下: 总体上,多核CPU的性能并无很好的可扩展性.在很多实验结果中,使用16核CPU的性能仅比使用4核或8核稍好.TensorFlow在CPU环境有相对较好的可扩展性. 仅用一块GPU卡的话,FCN上Caffe

专访阿里巴巴徐盈辉:深度学习和强化学习技术首次在双11中的大规模应用

12月6日-7日,由阿里巴巴集团.阿里巴巴技术发展部.阿里云联合主办,以"2016双11技术创新"为主题的阿里巴巴技术论坛(Alibaba Technology Forum,ATF)将在线举办.(https://yq.aliyun.com/promotion/139) 系列文章陆续发布: 专访阿里巴巴徐盈辉:深度学习和强化学习技术首次在双11中的大规模应用 专访阿里巴巴林伟:三项世界级挑战背后的思考.实践和经验 专访阿里巴巴魏虎:揭秘阿里双11背后的全站个性化&商铺千人千面 价

专访 | 杨强教授谈CCAI、深度学习泡沫与人工智能入门

7 月 22 - 23 日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁金服主办,CSDN.中国科学院自动化研究所承办,作为独家直播合作伙伴的第三届中国人工智能大会(CCAI 2017)将在杭州国际会议中心盛大开幕. 作为大会主席,香港科技大学计算机与工程系主任.AAAI Fellow 杨强教授最近接受了大会记者专访.这次访谈干货满满,其中有不少话题是杨强教授首度公开谈及,比如下一个 AI 突破口.深度学习泡沫.AI 之路心得.本科生入门 AI.好学生要能教导师学习,等等. (点击阅读杨强教授历史

2017GAITC专访 │ 深度学习分论坛主席季向阳

 [CAAI导读]从AlphaGo进去公众视野的那一天起,它就为普通百姓普及了人工智能这一概念.而人工智能也从幕后走到了台前.虽然有着无数赞美,但伴随而来的也是舆论对于人工智能的大讨论.  2017年5月21日至22日,由中国人工智能学会.中国中文信息学会主办的"2017全球人工智能技术大会"将在北京国家会议中心拉开序幕.本次大会为中国人工智能权威大会,以"交叉.融合.相生.共赢"为主题,将汇聚多位全球人工智能学术界和产业界著名学者.顶级专家和业界精英. 为了探寻这

专访 | 清华大学朱军:深度学习“盛行”,传统方法何去何从?

朱军博士是清华大学计算机系长聘副教授.智能技术与系统国家重点实验室副主任.卡内基梅隆大学兼职教授.2013年,入选IEEE Intelligent Systems的"人工智能10大新星"(AI's 10 to Watch).他主要从事机器学习研究,在国际重要期刊与会议发表学术论文80余篇.担任国际期刊IEEE TPAMI和Artificial Intelligence的编委.国际会议ICML 2014地区联合主席.以及ICML.NIPS等国际会议的领域主席. 清华大学计算机系长聘副教授

【重磅】Bengio 出山建立深度学习孵化器,寄语中国人工智能产业(附新智元独家专访视频)

Bengio 创建深度学习孵化器,试图打造 AI 生态圈 Yoshua Bengio,这位深度学习崛起背后的领军人物,成立了一个专注人工智能的硅谷式创业孵化器. 这个创业孵化器名为 Element AI,将帮助蒙特利尔大学(Bengio 是该大学的教授)和附近的 McGill 大学 AI 研究团队成立公司.Bengio 说,这只是他在蒙特利尔建立"AI生态圈"计划的一部分.Bengio 表示,蒙特利尔对深度学习的学术研究有着"全世界最多的关注",在这里孕育的 AI

徐立:1200层神经网络夺冠ImageNet,深度学习越深越好?| 新智元 AI 领军人物专访

人工智能领域的创业浪潮中,计算机视觉技术(CV)可以说是一个较为火热的方向,呈遍地开花之势.在这片江湖中,有四家公司特别突出,有 CV 领域的"一桶筐汤" 之称,可以看成是具有巨大潜力的"四小龙". 其中,"汤"在这里指的就是创建于2014年的商汤科技开发有限公司.其他三家"一"指创立于2016年的依图科技."桶"指的是2014年的"格灵深瞳","筐"指的是成立于20