KDD2016论文精品解读(一)

联合编译:章敏,高斐,陈杨英杰

导读:KDD2016是首屈一指的跨学科会议,它聚集了数据科学,数据挖掘,知识发现,大规模数据分析和大数据方面的研究人员和从业人员。

论文一题目:稳定流体近似的卷积神经网络

摘要

在空气动力学相关设计、分析和优化问题方面,流场是通过使用计算流体动态学(CFD)求解器进行模拟的。然而,CFD模拟通常是计算昂贵,内存要求大、且耗时的迭代过程。CFD的这些缺点,限制了设计空间探索的机会,同时也破灭了交互设计的想法。我们提出了一个通用且灵活的近似模型,用于实时预测基于卷积神经网络(CNNs)的二维或三维领域中不均匀的稳态层流体。我们探索了几何表示的替代品和CNNs的网络体系结构。我们表明,卷积神经网络估计速度场的速度,可以比一个GPU加速的CFD求解器快两个数量级,比一个基于CPU的CFD求解器快四个数量级(以非常低的错误为代价)。这种方法可以在设计的早期阶段,为实时的交互设计提供即时反馈。相比于空气动力学领域现存的近似模型,CNNs确保了对整个速度场的有效评估。进一步说,设计师和工程师可以在不需要训练额外更低维度替代模型的情况下,直接将CNN近似模型应用到他们的设计空间探索算法中。

关键词:卷积神经网络;替代模型;计算流体动态学;机器学习

论文作者介绍

(1)Xiaoxiao Guo

学校:密歇根大学-安娜堡分校(University of Michigan) 

研究领域:机器学习(Machine Learning)人工智能(Artificial intelligence)

更多相关领域论文:

·Deep learning for real-time Atari game play using offline Monte-Carlo tree search planning(2014 )

·Action-conditional video prediction using deep networks in atari games(2015)

·Deep Learning for Reward Design to Improve Monte Carlo Tree Search in ATARI Games(2016)

(2)Wei Li 

机构:Autodesk Research

研究方向:人机交互绘图,人工机器智能 ,跨科学

更多相关论文:

·Automated Extraction of System Structure Knowledge from Text(IDETC/CIE 2016 Conference)

·Four-Bar Linkage Synthesis Using Non-Convex Optimization(CP 2016 Conference )

(3)Francesco Iorio 

机构:Autodesk Research 

研究方向:多种核心和多核心系统上软件可扩展性、混合计算、在各种高性能平台上的加速器系统,通用设计和并行算法开发。

更多相关论文:

·Four-Bar Linkage Synthesis Using Non-Convex Optimization(CP 2016 Conference )

·Automated Extraction of System Structure Knowledge from Text(IDETC/CIE 2016 Conference)

论文二题目:基于图像的聚类法的结构化双随机矩阵

 摘要   

作为最为重要的机器学习研究主题之一,聚类算法已经被广泛应用于多种不同的领域。目前,聚类算法在科学研究和工业实践中的普遍应用业已引起高度的关注。研究者已经提出大量的聚类算法,其中备受重视的当属运用相似矩阵基于图像的聚类方法。近来的研究工作使用双随机矩阵以规范输入相似矩阵,并改善基于图像的聚类模型。尽管这种双随机矩阵能够提高聚类模型的性能,其聚类结构并未如期望中那么清晰明了。因而,需要采用后置处理步骤提取最终聚类结果,所得结果可能并不太理想。为了解决这一问题,本文我们提出一种新型凸模型,低秩约束图像拉普拉斯矩阵,运用该种新型模型学习结构化双随机矩阵。我们的新型结构化双随机矩阵能够直接显示聚类结构,并为将要连接在一起的成对数据点的概率编码,由此来改善聚类结果。我们获得了一种高效率的优化算法,以实现新的研究目标。此外,当输入信息不同时,我们采用的方法能够分别与K均值,谱图切割模型获取联系,在文中我们也将就此话题做理论层面的讨论。我们基于合成和基准数据集开展实验研究,以验证我们所提出的方法的性能。实证研究结果证明,我们的模型为更好地解决K均值聚类问题提供了方法和途径。把由我们的模型提供的聚类指示结果作为初始值,K均值收敛等于一个更小的目标函数值,以取得更好地聚类性能。此外,将由我们模型的聚类性能与普聚类法和相关联的双随机模型的性能进行比较。在所有的数据集中,我们的模型的性能能够与其他相关模型相媲美,甚至优于其他模型。

关键词:双随机矩阵;图像拉普拉斯矩阵学习,K均值聚类算法,谱聚类算法

论文作者介绍

(1)Xiaoqian Wang 

学校:美国德州大学阿灵顿分校计算机科学与工程系博士,

主要研究领域:机器学习与计算机生物学

相关学术成果:

·Clustering and projected clustering with adapted neighbors. (Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. 2014. P977-986.)

·Higher-order dispersion compensation to enable a 3.6 μs wavelength-maintaining delay of a 100 Gb/s DQPSK signal(Optics letters.2010.p.2985-2987.)

·The Contrained Laplacian Rank Algorithm for Graph-Based Clustering(Thirtieth AAAI Conference on Artificial Intelligence.)

 (2)Feiping Nie,聂飞平,

学校:美国德州大学阿灵顿分校计算机科学与工程系教授、博导,

研究方向:机器学习以及相关应用领域(模式识别,数据挖掘,计算机视觉,图像处理,信息检索等)的研究与开发工作。

相关学术成果:

·New Primal SVM Solver with Linear Computational Cost for Big Data Classifications(The 31st International Conference on Machine Learning (ICML), 2014.)

·Optimal Mean Robust Principal Component Analysis(The 31st International Conference on Machine Learning (ICML), 2014.)

·Robust Distance Metric Learning via Simultaneous L1-Norm Minimization and Maximization(The 31st International Conference on Machine Learning (ICML), 2014.)

(3)Heng Huang

学校:美国德州大学阿灵顿分校计算机科学与工程教授,德克萨斯大学西南医学中心临床科学兼职教授,主要研究方向:大数据挖掘,机器学习,数据科学,生物信息学,系统生物学,神经信息学,脑科学,计算机视觉,医学图像分析,计算的可持续性,自然语言处理等研究领域。

相关学术成果:

·Structured Doubly Stochastic Matrix for Graph Based Clustering(22nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2016), Research Track, accepted to appear.)

·Robust and Effective Metric Learning Using Capped Trace Norm(22nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2016), Research Track, accepted to appear.)

·New Multi-Task Learning Model to Predict Alzheimer's Disease Cognitive Assessment(18th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2016), accepted to appear.)

论文三题目:结构化深层网络嵌入

摘要

网络嵌入是一种学习网络顶点低维表示的重要方法,旨在捕获和保存网络结构。几乎所有的现有网络嵌入方法都采用的是浅层模型。然而,由于底层的网络结构很复杂,浅层的模型不能捕获高度非线性的网状结构,得到的是次优的网络表示。因此,如何找到一种既能有效地捕获高度非线性网络结构,又能保存全局和局部结构的方法是一个公开但重要的问题。为了解决这个问题,本文提出了一种结构化深层网络嵌入方法,即SDNE。更具体地说,我们首先提出了一种半监督深层模型,其具有多层非线性函数,从而能够捕获高度非线性网络结构。然后,我们提出,同时利用一阶近似和二阶近似来保存网络结构。二阶近似被无监督部件用来捕获全局网络结构。而一阶近似作为监督部件中的监督信息,被用来保存局部网络结构。通过在半监督深层模型中的共同优化,我们的方法可以同时保存局部和全局网络结构,并对稀疏网络具有较好的鲁棒性。根据经验,我们在五个真实世界的网络中进行实验,包括一个语言网络,一个引用网络和三个社交网络。结果表明,相比于基准,我们的方法明显能更好地重构原始网络,并且在三个应用上有持续收获,即多标记分类,链路预测和可视化。

关键词:网络嵌入,深度学习,网络分析

论文作者介绍:

(1)Daixin Wang(王岱鑫)

学校:清华大学计算机系

(2)Peng Cui(崔鹏)

学校:清华大学计算机系副教授

研究方向:机器学习、数据挖掘、社会媒体等。

(3)Wenwu Zhu(朱文武)

学校:清华大学计算机系国家“千人计划”特聘教授、博士生导师、系副主任,国家特聘专家,国家973项目首席科学家。曾任微软亚洲研究院主任研究员,英特尔中国研究院首席科学家,及美国贝尔实验室研究员等职。IEEE Fellow、SPIE Fellow、ACM Distinguished Scientist。

研究方向:三元空间大数据计算、社会化多媒体计算、多媒体云计算、未来多媒体通信与网络等。

本文作者:章敏

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-08-31 05:50:21

KDD2016论文精品解读(一)的相关文章

KDD2016论文精品解读(二)

联合编译:高斐,章敏,陈杨英杰 导读:KDD2016是首屈一指的跨学科会议,它聚集了数据科学,数据挖掘,知识发现,大规模数据分析和大数据方面的研究人员和从业人员. 论文一:在频率域中压缩卷积神经网络 摘要  卷积神经网络(CNN)在计算机视觉的多个研究领域受到越来越广泛的应用.由于卷积神经网络能够通过利用数以百万计的参数,"吸收"大量的标记数据,这种神经网络的应用受到普遍关注.然而,随着模型尺寸不断增大,对分类器的储存与记忆要求也不断提升,如此便对许多应用,如手机及其他设备的图像识别,

【阿里ICCV论文技术解读】基于层次化多模态LSTM的视觉语义联合嵌入

精准描述商品:计算机视觉和自然语言处理的联合 近年来, 随着深度学习技术的快速发展, 人们开始尝试将计算机视觉(Vision)和自然语言处理(Language)两个相对独立的领域联合起来进行研究, 实现一些在过去看来非常困难的任务,例如"视觉-语义联合嵌入(Visual-Semantic Embedding)".该任务需要将图像及语句表示成一个固定长度的向量,进而嵌入到同一个矢量空间中.这样,通过该空间中的近邻搜索可以实现图像和语句的匹配.检索等. 视觉语义联合嵌入的一个典型应用就是图

CVPR 2017最佳论文作者解读:DenseNet 的“what”、“why”和“how”|CVPR 2017

雷锋网 AI 科技评论按:CVPR 2017上,康奈尔大学博士后黄高博士(Gao Huang).清华大学本科生刘壮(Zhuang Liu).Facebook 人工智能研究院研究科学家 Laurens van der Maaten 及康奈尔大学计算机系教授 Kilian Q. Weinberger 所作论文<Densely Connected Convolutional Networks>当选 CVPR 2017 最佳论文,与苹果的首篇公开论文<Learning From Simulate

Facebook 在CVPR 2017的四篇论文精选解读|CVPR 2017

CVPR是IEEE一年一度的计算机视觉与模式识别技术会议,也是计算机视觉的世界三大顶会之一.2017年的CVPR会议将于7月21日到26日于夏威夷Convention中心召开,雷锋网将赴前线做覆盖与报道. 论文一:ResNext:Aggregated Residual Transformations for Deep Neural Networks 深层神经网络的聚合残差变换 论文作者:Saining Xie, Ross Girshick, Piotr Dollar, Zhuowen Tu1,

人性不变,泡沫永存!27前年经典诺奖得主论文再解读

2015年6月15日开始,上证指数从最高点5178自由落体到3373点,跌幅达34.9%,深圳成指跌40.4%,创业板指数跌42.9%.千股跌停.千股停牌.千股涨停.千股复牌,我们和市场一起见证了这场焦灼亿万股民,重创国民财富的股灾.简单的数据,隐藏了多少人的迷茫与无奈,悲伤与痛苦. 历史总是惊人的相似.1987年8月到10月,美国标普500指数下跌35.9%,道琼斯指数下跌40.9%,尤其是最后几天的单日巨大跌幅(美国股市无涨跌停限制),让整个市场弥漫着世界末日般的绝望和彷徨.抚今忆昔,令人不

CVPR 2017精彩论文解读:显著降低模型训练成本的主动增量学习 | 分享总结

雷锋网(公众号:雷锋网) AI 科技评论按:计算机视觉盛会 CVPR 2017已经结束了,雷锋网 AI 科技评论带来的多篇大会现场演讲及收录论文的报道相信也让读者们对今年的 CVPR 有了一些直观的感受. 论文的故事还在继续 相对于 CVPR 2017收录的共783篇论文,即便雷锋网 AI 科技评论近期挑选报道的获奖论文.业界大公司论文等等是具有一定特色和代表性的,也仍然只是沧海一粟,其余的收录论文中仍有很大的价值等待我们去挖掘,生物医学图像.3D视觉.运动追踪.场景理解.视频分析等方面都有许多

CVPR 2017精彩论文解读:综合使用多形态核磁共振数据的3D生物医学图像分割方法 | 分享总结

雷锋网 AI 科技评论按:计算机视觉盛会 CVPR 2017已经结束了,雷锋网 AI 科技评论带来的多篇大会现场演讲及收录论文的报道相信也让读者们对今年的 CVPR 有了一些直观的感受. 论文的故事还在继续 相对于 CVPR 2017收录的共783篇论文,即便雷锋网(公众号:雷锋网)(公众号:雷锋网) AI 科技评论近期挑选报道的获奖论文.业界大公司论文等等是具有一定特色和代表性的,也仍然只是沧海一粟,其余的收录论文中仍有很大的价值等待我们去挖掘,生物医学图像.3D视觉.运动追踪.场景理解.视频

CVPR2017精彩论文解读:效果更显著的模型压缩算法和泛化优化算法

雷锋网(公众号:雷锋网) AI科技评论按:虽然CVPR 2017已经落下帷幕,但对精彩论文的解读还在继续.下文是优必选悉尼AI研究院对其入选CVPR 2017的两篇论文<基于低秩稀疏分解的深度模型压缩算法>和<利用奇异值界定提升深度神经网络训练效果和识别精度>进行的解读,除此之外他们还对会上Workshop竞赛的进行了相关介绍. 基于低秩稀疏分解的深度模型压缩算法--On Compressing Deep Models by Low Rank and Sparse Decompos

CVPR2017精彩论文解读:直接处理三维点云的深度学习模型

雷锋网(公众号:雷锋网) AI 科技评论按:虽然CVPR 2017已经落下帷幕,但对精彩论文的解读还在继续.下文是Momenta高级研究员陈亮对此次大会收录的 PointNet:Deep Learning on Point Sets for 3D Classification and Segmentation  一文进行的解读. 随着激光雷达,RGBD相机等3D传感器在机器人,无人驾驶领域的广泛应用.针对三维点云数据的研究也逐渐从低层次几何特征提取( PFH, FPFH,VFH等)向高层次语义理