《图数据库》——1.1 图是什么

1.1 图是什么

图数据库
说得正式一点儿,图仅仅是顶点和边的集合,或者说更简单一点儿,图就是一些节点和关联这些节点的联系(relationship)的集合。图将实体表现为节点,实体与其他实体连接的方式表现为联系。我们可以用这个通用的、富有表现力的结构来建模各种场景,从宇宙火箭的建造到道路系统,从食物的供应链及原产地追踪到人们的病历,甚至更多其他的场景。

无处不在的图

在我们了解科学、政府和商业领域的数据集广泛多样性的过程中,图起到了极大的作用。现实世界完全不同于关系型数据库背后的基于表的模型,它是丰富的且相互之间充满关联:有些部分是统一而规则的,而其他部分是特殊的、不规则的。一旦理解了图,你就会发现图无处不在。比如,Gartner定义了商业世界的5个图—社交、意向、消费、兴趣和移动,并指出运用这些图的能力是一个“可持续的竞争优势”。
就拿Twitter来说,它的数据很容易表示为一张图。在图1-1中我们可以看到由互相关注的人组成的一个小的社交网络。联系是这里建立语义上下文的关键,也就是说,Billy关注了(`javascript
FOLLOWS
`
Harry,反过来,Harry也关注了Billy,Ruth和Harry同样也是互相关注的,但是,尽管Ruth关注了Billy,但Billy却对他无动于衷。

当然,实际的Twitter图比图1-1要大数亿倍,但它们的工作原理是一样的。在图1-2中,我们把Ruth发布的消息也包含到图里面来。

尽管图很简单,但图1-2还是展示出了图模型的表现力。我们很容易从中看出Ruth发布了一连串的消息。通过标记为`javascript
CURRENT

联系可以找到最新的一条消息;```javascript
PREVIOUS

系建立了消息时间线。

属性图模型

在讨论图1-2的过程中,我们也顺便提一下一个最流行的图模型变体—属性图(property graph)(在附录A中我们会更详细地讨论其他可替代的图数据模型)。属性图具有如下特征。

它包含节点和联系。

节点上有属性(键值对)。

联系有名字和方向,并总是有一个开始节点和一个结束节点。

联系也可以有属性。

对于大部分人来说,属性图模型是直观且容易理解的。不过简单归简单,使用图将有价值的见解融入到数据中的大多数场景却都可以用属性图来描述。
本文仅用于学习和交流目的,不代表异步社区观点。非商业转载请注明作译者、出处,并保留本文的原始链接。

时间: 2024-10-15 09:21:24

《图数据库》——1.1 图是什么的相关文章

《图数据库(第2版)》——1.2 图领域概览

1.2 图领域概览 近年来,无数用于管理.处理和分析图的项目和产品纷纷涌入市场.技术选择的陡增使我们难以跟进这些工具并摸清它们之间的区别,即便对我们这些一直活跃在这个领域的人来说也是如此.本节的内容对理解新兴的图领域提供了一个"高空俯览". 从高空俯看,我们可以将图领域划分成以下两部分. 主要用于联机事务图的持久化技术,通常直接实时地被应用程序访问 这类技术被称为图数据库,正是本书主要讨论的内容.它们和"常见的"关系型数据库世界中的联机事务处理(online tra

《图数据库(第2版)》——1.4 小结

1.4 小结 本章中,我们回顾了属性图模型,它可以简单而传神地表示关联数据.属性图用生动而灵活的方式捕捉复杂的领域,与此同时,图数据库则使我们可以运用图模型以更加简单的方式开发应用程序. 在下一章中,我们将更详细地探讨不同的技术是怎样应对关联数据带来的挑战的,从关系型数据库开始,到聚合NoSQL存储,最后到图数据库.在讨论的过程中,我们将看到为什么图和图数据库是建模.存储和查询关联数据的最佳方式.之后的几章将会展示如何设计和实施基于图数据库的解决方案.

《图数据库》——1.4 小结

1.4 小结 图数据库本章介绍了属性图模型,在表示关联数据上,它简单却传神.属性图用生动而灵活的方式捕捉复杂的领域,与此同时,图数据库则使我们可以运用图模型以更加简单的方式开发应用程序. 在下一章中,我们将更详细地探讨不同的技术是怎样应对关联数据带来的挑战的,从关系型数据库开始,到聚合NoSQL存储,最后到图数据库.在讨论的过程中,我们将看到为什么图和图数据库是建模.存储和查询关联数据的最佳方式.之后的几章将会展示如何设计和实施一个以图数据库为基础的解决方案. 本文仅用于学习和交流目的,不代表异

《图数据库》——1.2 图领域概览

1.2 图领域概览 图数据库近年来,无数用于管理.处理和分析图的项目和产品纷纷涌入市场.技术选择的陡增使我们难以跟进这些工具并摸清它们之间的区别,即便对我们这些一直活跃在这个领域的人来说也是如此.本节的内容对理解新兴的图领域提供了一个"高空俯览". 从1万英尺高空往下看,我们可以将图领域划分成以下两部分. 用于联机事务图的持久化技术通常直接实时地从应用程序中访问这类技术被称为图数据库,正是本书主要讨论的内容.它们和"通常的"关系型数据库世界中的联机事务处理(onli

《图数据库(第2版)》导读

前言 图数据库(第2版)图数据库应对的是当今一个宏观商业世界的大趋势:凭借高度关联的数据中复杂而动态的联系获得洞察力并赢得竞争优势.无论我们想了解的是客户之间的联系,电话或数据中心网络元素之间的联系,娱乐产品制作者和消费者之间的联系,还是基因和蛋白质之间的联系,都会涉及大量的高度关联的数据.这些数据又会构成庞大的图,而理解和分析这些图的能力将成为公司在未来10年的核心竞争力. 对于任何达到一定规模或价值的数据,图数据库都是呈现和查询这些关联数据的最好方式.关联数据是这样的一种数据:它需要我们首先

《图数据库(第2版)》——第1章 简介

第1章 简介 图数据库(第2版)虽然本书大部分内容是讨论图数据模型的,但这并不是一本关于图论的书.[1] 使用图数据库并不需要太多的理论知识:只要知道什么是图就够了.记住这一点,下面来大体回顾一下我们对图的认识.

《图数据库(第2版)》——第2章 关联数据的存储选择

第2章 关联数据的存储选择 图数据库(第2版)我们生活在互联的世界中.为了发展进步,我们需要理解并影响所处的网络. 如今的技术是如何处理关联数据的呢?本章关注于关系型数据库和聚合NoSQL存储如何管理图和关联数据,并比较这些数据库或存储与图数据库在处理图和关联数据方面的性能.对NoSQL有兴趣的读者可以深入阅读附录中描述的4种主流NoSQL数据库.

《图数据库(第2版)》——1.1 图是什么

1.1 图是什么 形式上,图不过是顶点和边的集合,或者说更简单一点儿,图就是一些节点和关联这些节点的联系的集合.图将实体表现为节点,实体与其他实体连接的方式表现为联系.我们可以用这个通用而富有表现力的结构来为各种场景建模,从宇宙火箭的建造到道路系统,从食物的供应链及原产地追踪到人们的病历,甚至更多. 无处不在的图 在我们了解科学.政府和商业领域的数据集广泛多样性的过程中,图起到了极大的作用.现实世界完全不同于关系型数据库背后的基于表的模型,它是丰富的且相互之间充满关联:有些部分是统一而规则的,而

《图数据库(第2版)》——2.3 图数据库拥抱联系

2.3 图数据库拥抱联系 前面的例子处理了隐式的关联数据.作为用户,我们推断实体之间的语义相关性,但数据模型与数据库本身却忽视了这些关联.为了弥补这一点,我们的应用程序必须着手创建一个扁平的.无连接的数据之外的网络,然后再处理那些由反规范化存储导致的缓慢查询和延迟写入. 我们真正想要的是一个全景图,包括元素之间的关联.与我们之前看到的不同,在图的世界中,关联数据被存储为关联数据.只要问题域中存在关联,数据中就存在关联,如图2-5表示的社交网络. 在这个社交网络中,有如此多的实际情景中的关联数据,