《异构信息网络挖掘: 原理和方法(1)》一1.3 本书的内容组织

1.3 本书的内容组织

第1章介绍了异构信息网络挖掘问题。然后,本书分为三个部分,每个部分包含两章内容,它们讲述了异构信息网络挖掘的原理和方法,并且按照不同的挖掘任务来组织。最后,第8章概述了这一研究领域的一些开放研究题目。第2~7章的主要内容总结如下。
第一部分:基于排名的聚类和分类。通过区别不同链接类型间的信息传播,我们介绍了若干基本挖掘任务的研究,例如在异构信息网络中的聚类与分类。
第2章:基于排名的聚类。对于异构信息网络中基于链接的聚类,我们需要探索异构数据类型间的链接。最近的研究开发的基于排名的聚类方法(如RankClus[66]和NetClus[69])能高效地生成聚类和排名结果。这种方法基于如下观察:排名和聚类可以相互提高,因为在每个聚类中排名高的对象更有助于明晰化聚类,并且明显属于某个聚类的对象更容易在该类中获得高的排名。
第3章:异构信息网络的分类。分类也可以利用异构信息网络中的链接。知识可以在异构网络中有效传播,这是因为由相同类型的链接相似连接着的相同类型节点很可能是相似的。此外,根据基于排名的聚类的思想,可以探索基于排名的分类,因为在一个类中排名高的对象可能对分类有非常重要的作用。基于这些思想,研究者设计了有效的分类算法,例如GNetMine[31]和RankClass[30]。
第二部分:基于元路径的相似性搜索和挖掘。我们介绍了一个基于元路径的系统化方法来处理一般性的带有特定网络模式的异构信息网络。在这个框架下,相似性搜索和其他挖掘任务(如关系预测)都能通过对网络的元结构进行系统化探索得到解决。
第4章:基于元路径的相似性搜索。相似性搜索在网络分析中有着重要作用。通过考虑网络中的各种链接路径(即元路径),可以获得异构信息网络中关于相似性的各种语义。文献[65]介绍了一种基于元路径的相似性评价方法,称为PathSim,它用于发现网络中的对等对象。与基于随机游走的相似性评价方法相比,PathSim已被证明在许多应用场景中更有意义。
第5章:基于元路径的关系预测。异构信息网络带来了多种对象类型之间的交互,使得预测异构类型对象间的关系成为可能。通过系统化地设计网络中基于元路径的拓扑特征和评价方法,监督模型可以用来在关系预测中学习适当的权重以及相关的各种拓扑特征[62;63]。
第三部分:关系强度感知挖掘,对象类型间关系的异质性往往导致挖掘结果的不一致,我们通过用户选择来解决该问题。通过用户引导,每个关系的强度都可以自动地学习,从而实现更好的挖掘。
第6章:不完全属性的关系强度感知聚类。通过指定一组属性,异构信息网络中不同关系的强度可以自动地学习以帮助网络聚类[61]。
第7章:通过元路径选择的用户引导聚类。异构信息网络中,不同的元路径代表不同的关系,携带不同的语义。用户引导,比如提供某一对象类型的少量训练样例,可以表明用户对此聚类结果有偏好。这样,能够学习到一个有偏好的元路径或者带权元路径的组合,使得挖掘结果与训练样例更加一致[67]。

时间: 2024-09-24 06:00:17

《异构信息网络挖掘: 原理和方法(1)》一1.3 本书的内容组织的相关文章

《异构信息网络挖掘: 原理和方法(1)》一导读

前 言 当下大数据技术发展变化日新月异,大数据应用已经遍及工业和社会生活的方方面面,原有的数据管理理论体系与大数据产业应用之间的差距日益加大,而工业界对于大数据人才的需求却急剧增加.大数据专业人才的培养是新一轮科技较量的基础,高等院校承担着大数据人才培养的重任.因此大数据相关课程将逐渐成为国内高校计算机相关专业的重要课程.但纵观大数据人才培养课程体系尚不尽如人意,多是已有课程的"冷拼盘",顶多是加点"调料",原材料没有新鲜感.现阶段无论多么新多么好的人才培养计划,都

《异构信息网络挖掘: 原理和方法》—— 第1章 引言

第1章 引言     我们生活在一个相互连接的世界中.大量的数据或信息化对象.个体.群组或其组成部件之间相互联系.相互影响,形成了数量众多.规模庞大.相互连接的复杂网络.不失一般性,本书称这种相互连接的网络为信息网络(information network).信息网络的实例包括社交网络.万维网.研究成果发表网络[22].生物网络[55].交通网络[32].公共健康系统.电网,等等.显然,信息网络随处可见,是现代信息基础设施的重要组成部分.如今,对信息网络或某些特殊类型信息网络(如社交网络和万维网

《异构信息网络挖掘: 原理和方法》—— 1.2 为什么异构网络挖掘是一项新的挑战

1.2 为什么异构网络挖掘是一项新的挑战     已设计出许多方法用于分析同构信息网络,特别是在社交网络[1]领域,已有排名.社区探测.链接预测.影响分析等方法.然而,这些方法中的大多数并不能直接应用于异构信息网络挖掘.这不仅是因为连接不同类型实体的异构链接可能携带不一样的语义,还因为一般情况下,异构信息网络比同构网络具有更加丰富的信息.通常,对异构信息网络进行投影可以得到同构信息网络,但是这样会明显地丢失信息.例如,对一个完整的异构文献网络在合作者信息上进行投影,可以得到一个合作者网络.然而,

《异构信息网络挖掘: 原理和方法》—— 1.3 本书的内容组织

1.3 本书的内容组织     第1章介绍了异构信息网络挖掘问题.然后,本书分为三个部分,每个部分包含两章内容,它们讲述了异构信息网络挖掘的原理和方法,并且按照不同的挖掘任务来组织.最后,第8章概述了这一研究领域的一些开放研究题目.第2~7章的主要内容总结如下.第一部分:基于排名的聚类和分类.通过区别不同链接类型间的信息传播,我们介绍了若干基本挖掘任务的研究,例如在异构信息网络中的聚类与分类.    第2章:基于排名的聚类.对于异构信息网络中基于链接的聚类,我们需要探索异构数据类型间的链接.最近

《异构信息网络挖掘: 原理和方法(1)》一1.2 为什么异构网络挖掘是一项新的挑战

1.2 为什么异构网络挖掘是一项新的挑战 已设计出许多方法用于分析同构信息网络,特别是在社交网络[1]领域,已有排名.社区探测.链接预测.影响分析等方法.然而,这些方法中的大多数并不能直接应用于异构信息网络挖掘.这不仅是因为连接不同类型实体的异构链接可能携带不一样的语义,还因为一般情况下,异构信息网络比同构网络具有更加丰富的信息.通常,对异构信息网络进行投影可以得到同构信息网络,但是这样会明显地丢失信息.例如,对一个完整的异构文献网络在合作者信息上进行投影,可以得到一个合作者网络.然而,这样的投

《异构信息网络挖掘: 原理和方法(1)》一第1章 引言

第1章 引言 我们生活在一个相互连接的世界中.大量的数据或信息化对象.个体.群组或其组成部件之间相互联系.相互影响,形成了数量众多.规模庞大.相互连接的复杂网络.不失一般性,本书称这种相互连接的网络为信息网络(information network).信息网络的实例包括社交网络.万维网.研究成果发表网络[22].生物网络[55].交通网络[32].公共健康系统.电网,等等.显然,信息网络随处可见,是现代信息基础设施的重要组成部分.如今,对信息网络或某些特殊类型信息网络(如社交网络和万维网)的分析

《异构信息网络挖掘: 原理和方法》—— 导读

前 言     当下大数据技术发展变化日新月异,大数据应用已经遍及工业和社会生活的方方面面,原有的数据管理理论体系与大数据产业应用之间的差距日益加大,而工业界对于大数据人才的需求却急剧增加.大数据专业人才的培养是新一轮科技较量的基础,高等院校承担着大数据人才培养的重任.因此大数据相关课程将逐渐成为国内高校计算机相关专业的重要课程.但纵观大数据人才培养课程体系尚不尽如人意,多是已有课程的"冷拼盘",顶多是加点"调料",原材料没有新鲜感.现阶段无论多么新多么好的人才培养

《异构信息网络挖掘: 原理和方法》—— 1.1 异构信息网络是什么

1.1 异构信息网络是什么     信息网络是现实世界的抽象,关注于对象以及对象之间的交互.事实证明,这一层次的抽象既具有表达和存储现实世界本质信息的强大能力,同时通过运用链接的信息,为从现实世界挖掘知识提供了一个有用的工具.形式上,我们如下定义一个信息网络.     不同于传统网络的定义,我们明确区分网络中的对象类型和关系类型.注意,如果类型A和类型B之间存在一个关系,记为A R B,那么,对于其逆关系R-1,自然有B R-1 A成立.通常,R和其逆R-1是不相等的,除非其链接的两个对象具有相

《异构信息网络挖掘: 原理和方法(1)》一1.1 异构信息网络是什么

1.1 异构信息网络是什么 信息网络是现实世界的抽象,关注于对象以及对象之间的交互.事实证明,这一层次的抽象既具有表达和存储现实世界本质信息的强大能力,同时通过运用链接的信息,为从现实世界挖掘知识提供了一个有用的工具.形式上,我们如下定义一个信息网络. 定义11信息网络 是一个带有对象类型映射函数τ:→和链接类型映射函数:→的有向图G=(,),其中每个对象ν∈属于一个特定的对象类型τ(ν)∈,每个链接e∈属于一个特定的关系(e)∈,如果两个链接属于同一个关系类型,那么这两个链接具有相同类型