为了与大家取得“共同的语言”,下面对一些概念和术语赋予确定的含义。
1、数据(data):对客观事物的符号表示,在计算科学中指所有能输入到计算机中并被计算机程序处理的符号总称。
2、数据元素(data element):是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。一个数据元素可以由若干个数据项(data item)组成,数据项是数据不可分割的最小单位。
3、数据对象(data object):性质相同的数据元素的组合,是数据的一个子集。
总结而言,数据、数据对象、数据元素和数据项之间的关系可以总结为:数据项是数据不可分割的最小单位,若干个数据项可以组成一个数据元素,性质相同的数据元素是数据对象,而数据对象是数据的一个子集。
4、数据结构(data structure):是相互之间存在一种或多种特定关系的数据元素的集合。这种数据元素相互之间的关系称为结构(structure)。根据数据元素之间的不同特性,通常有下列4类基本结构:
(1)、集合:结构中的数据元素之间除了“同属于一个集合”的关系外,别无其他关系;
(2)、线性结构:结构中的数据元素之间存在一对一的关系;
(3)、树形结构:结构中的数据元素之间存在一对多的关系;
(4)、图状结构或网状结构:结构中的数据元素之间存在多对多的关系;
讨论数据结构的目的是为了在计算机中实现对它的操作,因此还需研究如何在计算机中的表示。
5、数据结构在计算机中的表示或映像成为数据的物理结构,又称存储结构。它包括数据元素的表示和关系的表示。
在计算机中表示信息的最小单位是二进制的一位(bit)。我们可以用一个由若干位组合起来形成的一个位串表示一个数据元素,称为这个位串为元素(element)或结点(node)。当数据元素由若干数据项组成时,位串中对应于各个数据项的子位串称为数据域(data field)。因此,元素或结点可以看成是数据元素在计算机中的映射。
6、数据元素之间的关系在计算机中的有两种不同的表示方法:顺序映射和非顺序映射,并由此得到两种不同的存储结构:顺序存储结构和链式存储结构。
顺序映射的特点:借助元素在存储器中的相应位置表示数据元素之间的逻辑关系。
非顺序映射的特点:借助指示元素存储地址的指针(pointer)表示数据元素之间的逻辑关系。
总而言之,数据的逻辑结构和物理结构是密切相关的两个方面:任何一个算法的设计取决于选定的数据(逻辑)结构,而算法的实现依赖于采用的存储结构。
7、数据类型(data type):是一个值的集合和定义在这个值集上的一组操作的总称。
抽象数据类型(abstract data type,ADT):指一个数学模型以及定义在该模型上的一组操作。
8、算法(algorithm):是对特定问题求解步骤的一种描述,它是指令的有限序列,其中每一条指令表示一个或多个操作。
一个算法还具有下列5个重要特性:
(1)、有穷性:一个算法必须总是在执行有穷步骤之后结束,且每一步都可在有穷时间内完成;
(2)、确定性:算法中的每一条指令必须有确切的含义,并且在任何条件下,算法只有唯一的一条执行路径,即对于相同的输入只能得到相同的输出;
(3)、可行性:算法中描述的操作都是可以通过已经实现的基本运算执行有限次实现的;
(4)、输入:一个算法有0个或多个输入,这些输入取自于某个特定对象的集合;
(5)、输出:一个算法有一个或多个输出,这些输出是同输入某些特定关系的量。
算法设计的要求:正确性、可读性、健壮性、效率与低存储量需求;
算法效率的度量:时间复杂度和空间复杂度。