《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型

3.5 信息世界与逻辑模型

3.5.1 概述

信息世界是数据库的世界,该世界着重于数据库系统的构造与操作。信息世界由逻辑模型描述。

由于数据库系统不同的实现手段与方法,因此逻辑模型的种类很多,目前常用的有层次模型、网状模型、关系模型、面向对象模型、谓词模型及对象关系模型等。其中,层次模型发展最早并盛行于20世纪的60~70年代。网状模型出现稍晚,且具有比层次模型更为优越的性能,它盛行于20世纪70~80年代。关系模型的概念出现于1970年,但由于在实现上的困难,直到20世纪70年代后期才出现实用性系统,并在80年代开始实用化。面向对象模型出现于20世纪的80年代,在90年代开始实用化。谓词逻辑模型出现于20世纪70年代末期,它表示力强,表示形式简单,已成为演绎数据库及知识库的主要模型。面向对象模型与谓词逻辑模型既是概念模型又可作为逻辑模型。对象关系模型是一种关系模型的面向对象扩充,它的概念模型是扩充的E-R模型,它也可以被视为面向对象模型的特例。上面的5种逻辑模型分别与前面的四种概念模型相对应,它们的对应关系见表3-3。

本章将重点介绍关系模型。

3.5.2 关系模型简介

关系模型(relational model)的基本数据结构是二维表,简称表(table)。大家知道,表格方式在日常生活中应用很广,特别是在商业系统中,如金融、财务处理经常使用表格形式表示数据框架,这给了我们一个启发,用表格作为一种数据结构有着广泛的应用基础,关系模型即是以此思想为基础建立起来的。

关系模型中的操纵与约束也是建立在二维表上的,它包括对一张表及多张表的查询、删除、插入及修改操作,以及相应于表的约束。

关系模型的思想是IBM公司的E.F.Codd于1970年在一篇论文中提出的,他在该年6月的ACM上所发表的论文《大型共享数据库的关系模型》(A Relational Model for Large Shared Data Banks)中提出了关系模型与关系模型数据库的概念与理论,并用数学理论作为该模型的基础支撑。由于关系模型有很多诱人的优点,因此,从那时起就有很多人转向此方面的研究,并在算法与实现技术上取得了突破。1976年以后出现了商用的关系模型数据库管理系统,如IBM公司在IBM-370机上实现的System-R系统,美国加州大学在DEC的PDP-11机上实现的基于UNIX的Ingres系统,Codd也因他所提出的关系模型与关系理论这项开创性工作而荣获了1981年计算机领域的最高奖——图灵(Turing)奖。

关系模型数据库由于其结构简单、使用方便、理论成熟而吸引了众多的用户,在20世纪80年代以后成为数据库系统中的主流模型,很多著名的系统纷纷出现并占领了数据库应用的主要市场。目前,主要产品有Oracle、SQL Server、DB2等。关系模型数据库管理系统的数据库语言也由多种形式而逐渐统一成一种标准化形式,即SQL语言。

3.5.3 关系模型的数据结构、操纵和约束

关系是一种数学理论,运用这种理论所得到的逻辑模型称关系模型,关系模型由关系数据结构、关系操纵及关系约束三部分组成。

1.关系数据结构

(1)表结构

关系模型统一采用二维表结构。二维表由表框架(frame)及表元组(tuple)组成。表框架由n个命名的属性组成,n称为属性元数(arity),每个属性有一个取值范围(即值域)。

在表框架中可以按行存放数据,每行数据称为一个元组,或称表的实例(instance)。实际上,一个元组由n个元组分量组成,每个元组分量是表框架中每个属性的投影值。一个表框架可以存放m个元组,m称为表的基数(cardinality)。

一个n元表框架及框架内m个元组构成了一个完整的二维表。表3-4给出了二维表的一个例子,这是一个有关学生(S)的二维表。

二维表一般满足下面七个性质:

(2)关系

(3)键

(4)关系与ER模型

虽然关系的结构简单,但它的表示范围广,E-R模型中的属性、实体(集)及联系均可用它表示,表3-5给出了E-R模型与关系间的比较。

在关系模型中,关系既能表示实体集又能表示联系。表3-6给出了某公司职工间上下级联系的关系表示。

2.关系操纵

关系模型的数据操纵就是建立在关系上的一些操作,一般有查询、删除、插入及修改四种操作。

(1)数据查询

用户可以查询关系数据库中的数据,它包括一个关系内的查询以及多个关系间的查询。

1)一个关系内查询的基本单位是元组分量,其基本过程是先定位后操作。所谓定位,包括纵向定位与横向定位,纵向定位就是指定关系中的一些属性(称列指定),横向定位就是选择满足某些逻辑条件的元组(称行选择)。通过纵向与横向定位后就可确定一个关系中的元组分量了。在定位后即可进行查询操作,即将定位的数据从关系数据库中取出并放入至指定内存。

2)多个关系间的数据查询可分为3步进行。第1步将多个关系合并成一个关系,第2步对合并后的一个关系进行定位,最后进行查询操作。其中,第2步与第3步可看作一个关系内的查询,故我们只介绍第1步。多个关系的合并可分解成两个关系的逐步合并,如果有3个关系R1、R2与R3,那么合并过程是先将R1与R2合并成R4,然后再将R4与R3合并成最终结果R5。

因此,对关系数据库的查询可以分解成三个基本定位操作与一个查询操作:

(2)数据删除

数据删除的基本单位是元组,用于将指定关系内的指定元组删除。它也分为定位与操作两部分,其中定位部分只需要横向定位而无需纵向定位,定位后即是执行删除操作。因此,数据删除可以分解为两个基本操作:

(3)数据插入

数据插入仅用于一个关系,即在指定关系中插入一个或多个元组。插入数据时不需定位,只需将元组插入关系。因此,数据插入只有一个基本操作:

(4)数据修改

数据修改是在一个关系中修改指定的元组与属性值。数据修改不是一个基本操作,它可以分解为两个更基本的操作:先删除需修改的元组,然后插入修改后的元组。

(5)关系操作小结

以上四种操作的对象都是关系,而操作结果也是关系,因此它们都是建立在关系上的操作。这四种操作可以分解成6种基本操作。这样,关系模型的数据操纵可以总结如下:

1)关系模型数据操纵的对象是关系,而操纵结果也是关系。

2)关系模型基本操作有如下六种(其中三种为定位操作,三种为查询、插入及删除操作):

(6)空值处理

在关系元组的分量中允许出现空值(null value)以表示信息的空缺,空值的含义如下:

在出现空值的元组分量中一般可用NULL表示。目前的关系数据库系统都支持空值,但是它们都具有如下两个限制:

1)关系的主键中不允许出现空值。因为主键是关系元组的标识,如主键为空值则失去了其标识的作用。

2)需要定义有关空值的运算。在算术运算中如果出现空值则其结果为空值,在比较运算中如果出现空值则其结果为F(假)。此外,在统计时,如果SUM、AVG、MAX、MIN中有空值输入,其结果也为空值,而在作COUNT时如有空值输入则其值为0。

3.关系中的数据约束

关系模型允许定义三类数据约束,分别是实体完整性约束、参照完整性约束以及用户定义的完整性约束。此外,关系的安全性约束、故障恢复与多用户的并发控制实际上也是数据约束,其具体说明可见第5章。

时间: 2024-07-28 17:18:41

《数据库技术原理与应用教程(第2版)》——3.5 信息世界与逻辑模型的相关文章

《数据库技术原理与应用教程第2版》——2.1数据库中的基本概念

第2章 数据库的基础知识 本章将介绍数据库的基础知识,包括基本概念.基本结构.应用平台及特点等.本章内容十分重要,它对全书具有提纲挈领的作用. 2.1数据库中的基本概念 1.数据 (1)数据的概念 数据(data)是现实世界中客体在计算机中的抽象表示.具体地说,它是一种计算机内的有限个数的一组符号表示. 由于数据是一种抽象的符号表示,因此它缺少语义,在必要时须对它作出语义解释. (2)数据的性质分类 1)数据的持久性:从存储时间看,数据一般分为两部分,其中一部分与程序仅有短时间的交互关系,随着程

《数据库技术原理与应用教程第2版》——第1章 数据、数据管理与数据处理1.1概述

第一篇 基础篇 数据库技术是计算机学科中的一门重要分支,它已有五十余年历史并已成为一门完整的学科,其主要内容包括基础理论.基本操作及开发应用等.数据库技术的基础理论部分是构成该学科的基石,它给出了该学科的抽象的.全局的研究结果并对整个学科起指导性作用.在本书中,基础部分由两方面内容组成,它们是数据库技术的一般性理论和关系数据库技术的理论.1数据库技术的一般性理论第1~3章介绍数据库技术的一般性理论.其中第1章介绍有关数据.数据管理与数据处理的一般性概念:第2章介绍数据库技术中的基础知识:第3章

《数据库技术原理与应用教程第2版》——1.6数据处理

1.6数据处理 当今,由于数据与人类社会的密切关系,数据处理已成为计算机应用的重要内容.在本书中,数据处理主要指的是数据库中数据的应用. 1.6.1数据处理的环境 在数据处理中,数据存放于计算机中,用户应用数据是通过访问数据库而实现的.而这种访问是在一定环境下进行的,随着计算机技术的发展,数据应用环境也不断变化,迄今为止一共有四种不同的环境,它们是:1)人机直接交互式环境:这是单机.集中式环境,用户为操作员.由操作员直接访问数据库中的数据,这是一种最为原始与简单的访问方式,在数据库发展的初期就采

《数据库技术原理与应用教程第2版》——1.2数据及其特性

1.2数据及其特性 数据是客观世界中的事物在计算机中的抽象,是数据库技术研究的主要对象.数据有很多特性,主要体现在以下几个方面:1.数据表示的广泛性数据是客观世界事物的抽象表示,现实世界中的客体都能用数据表示.所以我们说,数据反映了客观世界,它是现实世界在计算机中的一种模拟.例如,数据可以表示数值.文字,可以表示抽象的符号.推理:可以表示二维.三维及多维空间结构:可以表示时刻.日期.年代等时间形式:也可以表示图形.图像.声音.视频.音频等多媒体形式等.数据表示的广泛性表明它与现实世界紧密相关,与

《数据库技术原理与应用教程第2版》——

1.5 数据管理的变迁 数据管理是数据库技术的核心,在其发展历史中,它经历了多个阶段.1基本数据结构阶段(20世纪40-50年代)自20世纪40年代计算机出现至50年代这段时间中,由于当时计算机结构简单,应用面狭窄且存储单元少,对计算机内的数据的管理非常简单,主要由基于内存的私有的并依附于程序的数据结构管理.此阶段称为基本数据结构阶段.2文件阶段(20世纪50-60年代)文件系统是数据库系统发展的初级阶段,它出现于上世纪50年代中期,此时计算机中已有磁鼓.磁盘等大规模存储设备,计算机应用面也

《数据库技术原理与应用教程第2版》——第3章数据管理中的数据模型3.1数据模型的基本概念

第3章数据管理中的数据模型 数据模型是数据管理的基本特征抽象,也是了解与认识数据库管理的基础.本章将介绍数据模型的基本内容,它为下面进一步介绍数据库奠定了基础. 3.1数据模型的基本概念 数据是现实世界中客体的符号抽象,而数据模型(data model)则是数据管理特征的抽象.数据模型描述数据的结构.定义在结构上的操纵以及约束条件.它从抽象层次上描述了数据的静态特征.动态行为和约束条件,为数据库系统的表示和操作提供一个框架. 1.数据模型三种类型 数据模型按不同的应用层次分成三种类型,分别是概念

《数据库技术原理与应用教程第2版》——3.6计算机世界与物理模型

3.6计算机世界与物理模型 计算机世界是计算机系统与相应的操作系统的总称,概念世界与信息世界所表示的概 图3-13数据库物理模型的 三个层次念.方法.数据结构及数据操纵.控制等最终均须用计算机世界所提供的手段和方法实现.计算机世界一般用物理模型表示,而物理模型主要是指计算机系统的物理存储介质(特别是磁盘组织).操作系统的文件以及在它们之上的数据库中的数据组织的三个层次. 图3-13给出了数据库物理模型的三个层次. 3.6.1数据库的物理存储介质 与数据库有关的物理存储介质以磁盘存储器为主,共有以

《数据库技术原理与应用教程第2版》——2.3数据库系统的特点

2.3数据库系统的特点 数据库系统有很多特点,下面介绍几个基本特点. 1.数据的集成性 数据库系统的数据集成性主要表现在如下几个方面:1)在数据库系统中采用统一的数据结构方式,如在关系数据库中采用二维表这种统一结构方式.2)在数据库系统中按照多个应用的需要组织全局的.统一的数据结构(即数据模式).数据模式不仅可以建立全局的数据结构,还可以建立数据间的完整语义联系,也就是说,数据模式不仅描述数据自身,还描述数据间联系.3)数据库系统中的数据模式是多个应用共同的.全局的数据结构,而每个应用的数据则是

《数据库技术原理与应用教程第2版》——3.2数据模型的四个世界

3.2数据模型的四个世界 数据库中的数据模型可以将复杂的现实世界要求反映到计算机数据库中的物理世界,这种反映是一个逐步转化的过程,它分为四个阶段,这四个阶段被称为四个世界.转化过程由现实世界开始,经历概念世界.信息世界而至计算机世界,从而完成整个转化.由现实世界开始,每到达一个新的世界都是一次新的飞跃和提高.1)现实世界(real world).用户为了某种需要,需将现实世界中的部分需求用数据库实现.此时,它设定了需求及边界条件,这为整个转换提供了客观基础和初始启动环境.此时,人们所见到的是客观

《数据库技术原理与应用教程第2版》——2.2数据库内部结构体系

2.2数据库内部结构体系 数据库在构作时其内部具有三级模式和二级映射,三级模式分别是概念模式.内模式与外模式,二级映射则分别是从概念模式到内模式的映射以及外模式到概念模式的映射.这种三级模式与二级映射构成了数据库内部的抽象结构体系,如图24所示. 2.2.1数据库的三级模式 1.数据模式 数据模式(data schema)是数据库中数据的全局.统一结构形式的具体表示与描述,它反映了数据库的基本结构特性.一般而言,一个数据库都有一个与之对应的数据模式,而该数据库中的数据则按数据模式要求组织存放.