KDD2016论文精品解读（一）

联合编译：章敏，高斐，陈杨英杰

导读：KDD2016是首屈一指的跨学科会议，它聚集了数据科学，数据挖掘，知识发现，大规模数据分析和大数据方面的研究人员和从业人员。

论文一题目：稳定流体近似的卷积神经网络

摘要

在空气动力学相关设计、分析和优化问题方面，流场是通过使用计算流体动态学（CFD）求解器进行模拟的。然而，CFD模拟通常是计算昂贵，内存要求大、且耗时的迭代过程。CFD的这些缺点，限制了设计空间探索的机会，同时也破灭了交互设计的想法。我们提出了一个通用且灵活的近似模型，用于实时预测基于卷积神经网络（CNNs）的二维或三维领域中不均匀的稳态层流体。我们探索了几何表示的替代品和CNNs的网络体系结构。我们表明，卷积神经网络估计速度场的速度，可以比一个GPU加速的CFD求解器快两个数量级，比一个基于CPU的CFD求解器快四个数量级（以非常低的错误为代价）。这种方法可以在设计的早期阶段，为实时的交互设计提供即时反馈。相比于空气动力学领域现存的近似模型，CNNs确保了对整个速度场的有效评估。进一步说，设计师和工程师可以在不需要训练额外更低维度替代模型的情况下，直接将CNN近似模型应用到他们的设计空间探索算法中。

关键词：卷积神经网络；替代模型；计算流体动态学；机器学习

论文作者介绍

（1）Xiaoxiao Guo

学校：密歇根大学-安娜堡分校（University of Michigan）

研究领域：机器学习（Machine Learning）人工智能（Artificial intelligence）

更多相关领域论文：

·Deep learning for real-time Atari game play using offline Monte-Carlo tree search planning（2014 ）

·Action-conditional video prediction using deep networks in atari games（2015）

·Deep Learning for Reward Design to Improve Monte Carlo Tree Search in ATARI Games（2016）

（2）Wei Li

机构：Autodesk Research

研究方向：人机交互绘图，人工机器智能，跨科学

更多相关论文：

·Automated Extraction of System Structure Knowledge from Text（IDETC/CIE 2016 Conference）

·Four-Bar Linkage Synthesis Using Non-Convex Optimization（CP 2016 Conference ）

（3）Francesco Iorio

机构：Autodesk Research

研究方向：多种核心和多核心系统上软件可扩展性、混合计算、在各种高性能平台上的加速器系统，通用设计和并行算法开发。

更多相关论文：

·Four-Bar Linkage Synthesis Using Non-Convex Optimization（CP 2016 Conference ）

·Automated Extraction of System Structure Knowledge from Text（IDETC/CIE 2016 Conference）

论文二题目：基于图像的聚类法的结构化双随机矩阵

摘要

作为最为重要的机器学习研究主题之一，聚类算法已经被广泛应用于多种不同的领域。目前，聚类算法在科学研究和工业实践中的普遍应用业已引起高度的关注。研究者已经提出大量的聚类算法，其中备受重视的当属运用相似矩阵基于图像的聚类方法。近来的研究工作使用双随机矩阵以规范输入相似矩阵，并改善基于图像的聚类模型。尽管这种双随机矩阵能够提高聚类模型的性能，其聚类结构并未如期望中那么清晰明了。因而，需要采用后置处理步骤提取最终聚类结果，所得结果可能并不太理想。为了解决这一问题，本文我们提出一种新型凸模型，低秩约束图像拉普拉斯矩阵，运用该种新型模型学习结构化双随机矩阵。我们的新型结构化双随机矩阵能够直接显示聚类结构，并为将要连接在一起的成对数据点的概率编码，由此来改善聚类结果。我们获得了一种高效率的优化算法，以实现新的研究目标。此外，当输入信息不同时，我们采用的方法能够分别与K均值，谱图切割模型获取联系，在文中我们也将就此话题做理论层面的讨论。我们基于合成和基准数据集开展实验研究，以验证我们所提出的方法的性能。实证研究结果证明，我们的模型为更好地解决K均值聚类问题提供了方法和途径。把由我们的模型提供的聚类指示结果作为初始值，K均值收敛等于一个更小的目标函数值，以取得更好地聚类性能。此外，将由我们模型的聚类性能与普聚类法和相关联的双随机模型的性能进行比较。在所有的数据集中，我们的模型的性能能够与其他相关模型相媲美，甚至优于其他模型。

关键词：双随机矩阵；图像拉普拉斯矩阵学习，K均值聚类算法，谱聚类算法

论文作者介绍

（1）Xiaoqian Wang

学校：美国德州大学阿灵顿分校计算机科学与工程系博士，

主要研究领域：机器学习与计算机生物学

论文三题目：结构化深层网络嵌入

摘要

网络嵌入是一种学习网络顶点低维表示的重要方法，旨在捕获和保存网络结构。几乎所有的现有网络嵌入方法都采用的是浅层模型。然而，由于底层的网络结构很复杂，浅层的模型不能捕获高度非线性的网状结构，得到的是次优的网络表示。因此，如何找到一种既能有效地捕获高度非线性网络结构，又能保存全局和局部结构的方法是一个公开但重要的问题。为了解决这个问题，本文提出了一种结构化深层网络嵌入方法，即SDNE。更具体地说，我们首先提出了一种半监督深层模型，其具有多层非线性函数，从而能够捕获高度非线性网络结构。然后，我们提出，同时利用一阶近似和二阶近似来保存网络结构。二阶近似被无监督部件用来捕获全局网络结构。而一阶近似作为监督部件中的监督信息，被用来保存局部网络结构。通过在半监督深层模型中的共同优化，我们的方法可以同时保存局部和全局网络结构，并对稀疏网络具有较好的鲁棒性。根据经验，我们在五个真实世界的网络中进行实验，包括一个语言网络，一个引用网络和三个社交网络。结果表明，相比于基准，我们的方法明显能更好地重构原始网络，并且在三个应用上有持续收获，即多标记分类，链路预测和可视化。

关键词:网络嵌入，深度学习，网络分析

论文作者介绍：

（1）Daixin Wang（王岱鑫）

学校：清华大学计算机系

（2）Peng Cui（崔鹏）

学校：清华大学计算机系副教授

研究方向：机器学习、数据挖掘、社会媒体等。

（3）Wenwu Zhu（朱文武）

学校：清华大学计算机系国家“千人计划”特聘教授、博士生导师、系副主任，国家特聘专家，国家973项目首席科学家。曾任微软亚洲研究院主任研究员，英特尔中国研究院首席科学家，及美国贝尔实验室研究员等职。IEEE Fellow、SPIE Fellow、ACM Distinguished Scientist。

研究方向：三元空间大数据计算、社会化多媒体计算、多媒体云计算、未来多媒体通信与网络等。

本文作者：章敏

本文转自雷锋网禁止二次转载，原文链接

时间： 2024-11-03 03:58:14

KDD2016论文精品解读（一）

论文一题目：稳定流体近似的卷积神经网络

摘要

论文作者介绍

论文二题目：基于图像的聚类法的结构化双随机矩阵

摘要

论文作者介绍

论文三题目：结构化深层网络嵌入

摘要

论文作者介绍：

KDD2016论文精品解读（一）的相关文章

KDD2016论文精品解读（二）

【阿里ICCV论文技术解读】基于层次化多模态LSTM的视觉语义联合嵌入

CVPR 2017最佳论文作者解读：DenseNet 的“what”、“why”和“how”｜CVPR 2017

Facebook 在CVPR 2017的四篇论文精选解读｜CVPR 2017

人性不变，泡沫永存！27前年经典诺奖得主论文再解读

CVPR 2017精彩论文解读：显著降低模型训练成本的主动增量学习 | 分享总结

CVPR 2017精彩论文解读：综合使用多形态核磁共振数据的3D生物医学图像分割方法 | 分享总结

CVPR2017精彩论文解读：效果更显著的模型压缩算法和泛化优化算法

CVPR2017精彩论文解读：直接处理三维点云的深度学习模型