排序算法系列之二叉查找树

排序算法系列之二叉查找树

基本概念

  二叉查找树(Binary Search Tree),或者是一棵空树,或者是具有下列性质的二叉树:

  1. 若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值;
  2. 若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值;
  3. 它的左、右子树也分别为二叉排序树。

                                  

 
       序列:1 3 4 6 7 8 10 13 14                 序列:2 3 4 6 7 9 13 15 17 18 20               

 
 通常采取二叉链表作为二叉排序树的存储结构。中序遍历二叉排序树可得到一个关键字的有序序列,一个无序序列可以通过构造一棵二叉排序树变成一个有序序列,构造树的过程即为对无序序列进行排序的过程。每次插入的新的结点都是二叉排序树上新的叶子结点,在进行插入操作时,不必移动其它结点,只需改动某个结点的指针,由空变为非空即可。

二叉查找树查找算法思想

在二叉查找树b中查找x的过程为:

  1. 若b是空树,则搜索失败,否则:
  2. 若x等于b的根节点的数据域之值,则查找成功;否则:
  3. 若x小于b的根节点的数据域之值,则搜索左子树;否则:
  4. 查找右子树。

举例图:

二叉查找树插入算法思想

向一个二叉查找树b中插入一个节点s的算法,过程为:

  1. 若b是空树,则将s所指结点作为根节点插入,否则:
  2. 若s->data等于b的根节点的数据域之值,则返回,否则:
  3. 若s->data小于b的根节点的数据域之值,则把s所指节点插入到左子树中,否则:
  4. 把s所指节点插入到右子树中。

举例图:
                            

二叉查找树删除算法思想

在二叉排序树删去一个结点,分三种情况讨论:

  1. 若*p结点为叶子结点,即PL(左子树)和PR(右子树)均为空树。由于删去叶子结点不破坏整棵树的结构,则只需修改其双亲结点的指针即可。
  2. 若*p结点只有左子树PL或右子树PR,此时只要令PL或PR直接成为其双亲结点*f的左子树(当*p是左子树)或右子树(当*p是右子树)即可,作此修改也不破坏二叉排序树的特性。
  3. 若*p结点的左子树和右子树均不空。在删去*p之后,为保持其它元素之间的相对位置不变,可按中序遍历保持有序进行调整,可以有两种做法:其一是令*p的左子树为*f的左/右(依*p是*f的左子树还是右子树而定)子树,*s为*p左子树的最右下的结点,而*p的右子树为*s的右子树;其二是令*p的直接前驱(或直接后继)替代*p,然后再从二叉排序树中删去它的直接前驱(或直接后继)。

举例图:删除节点值 6。方便记忆:节点6的右孩子直接替换删除节点,节点6的左孩子挂在节点6的右孩子上。

二叉查找树性能分析

    每个结点的为该结点的层次数。最坏情况下,当先后插入的关键字有序时,构成的二叉排序树蜕变为单支树,树的深度为,其平均查找长度为(和顺序查找相同),最好的情况是二叉排序树的形态和折半查找的判定树相同,其平均查找长度和成正比。

二叉查找树C语言实现

代码来自http://chiyx.iteye.com/blog/1628947

c语言.h代码

/*file:biTree.h*/
#ifndef CHIYX_BITREE
#define CHIYX_BITREE
#ifndef NULL
#define NULL 0
#endif
typedef int DataType;
//二叉树的节点结构
typedef struct BiTreeNode {
	DataType data;
	struct BiTreeNode *parent;
	struct BiTreeNode *left;
	struct BiTreeNode *right;
}BiTreeNode, *BiTree;

//查找:返回第一个等于data域等于key的节点,不存在返回NULL
BiTreeNode *search(BiTree *biTree, DataType key);
//返回二叉树的最小节点,空树返回NULL
BiTreeNode *minImum(BiTree *biTree);
//返回二叉树的最大节点,空树返回NULL
BiTreeNode *maxImum(BiTree *biTree);
//返回节点x的后继节点,不存在后继(节点x为最大节点)返回NULL
BiTreeNode *successor(BiTreeNode *x);
//返回节点x的前驱节点,不存在前驱(节点x为最小节点)返回NULL
BiTreeNode *predecessor(BiTreeNode *x);
//将值data插入到二叉树中(生成一个值为data的节点)
void insertNode(BiTree *biTree, DataType data);
//删除一个值为data的节点
void deleteNode(BiTree *biTree, DataType data);
//中序遍历二叉树
void inorderTraversal(BiTree *biTree, void (*visitor)(BiTreeNode *node));
#endif
C语言实现代码:
/*file:biTree.c*/
#include <stdlib.h>
#include "biTree.h"

//查找:返回第一个等于data域等于key的节点,不存在返回NULL
BiTreeNode *search(BiTree *biTree, DataType key) {
	BiTreeNode *curNode = *biTree;
	while (curNode != NULL && curNode->data != key) {
		if (key < curNode->data) {
			curNode = curNode->left;
		} else {
			curNode = curNode->right;
		}
	}
	return curNode;
}
//返回二叉树的最小节点,空树返回NULL
BiTreeNode *minImum(BiTree *biTree) {
	BiTreeNode *curNode = *biTree;
	while (curNode != NULL && curNode->left != NULL) {
		curNode = curNode->left;
	}
	return curNode;
}
//返回二叉树的最大节点,空树返回NULL
BiTreeNode *maxImum(BiTree *biTree) {
	BiTreeNode *curNode = *biTree;
	while (curNode != NULL && curNode->right != NULL) {
		curNode = curNode->right;
	}
	return curNode;
}

//返回节点x的后继节点,不存在后继(节点x为最大节点)返回NULL
BiTreeNode *successor(BiTreeNode *x) {
         if (x == NULL) return NULL;
	//存在右子树,则后继节点为其右子树中最小的节点
	if (x != NULL && x->right != NULL) {
		return minImum(&(x->right));
	}
	while (x->parent != NULL && x->parent->right == x) {
		x = x->parent;
	}
	return x->parent; //错误版本为 x, 此处应该返回父结点
}
//返回节点x的前驱节点,不存在前驱(节点x为最小节点)返回NULL
BiTreeNode *predecessor(BiTreeNode *x) {
         if (x == NULL) return NULL;
	//存在左子树,则后继节点为其左子树中最大的节点
	if (x != NULL && x->left != NULL) {
		return maxImum(&(x->left));
	}
	while (x->parent != NULL && x->parent->left == x) {
		x = x->parent;
	}
	return x->parent; //错误版本为 x, 此处应该返回父结点

}

void insertNode(BiTree *biTree, DataType data) {
	//创建节点
	BiTreeNode *targetNode;

	targetNode = (BiTreeNode *)malloc(sizeof(BiTreeNode));
	//没有足够内存
	if (targetNode == NULL) return;
	targetNode->data = data;
	targetNode->parent = NULL;
	targetNode->left = NULL;
	targetNode->right = NULL;

	BiTreeNode *p, *y;
	p = *biTree;
	y = NULL;
	while (p != NULL ) {
		y = p;
		if (targetNode->data < p->data) {
			p = p->left;
		} else {
			p = p->right;
		}
	}
	//空树,将新节点置为树根
	if (y == NULL) {
		*biTree = targetNode;
	} else {
		if (targetNode->data < y->data) {
			y->left = targetNode;
		} else {
			y->right = targetNode;
		}
	}
	targetNode->parent = y;
}
//删除一个值为data的节点
void deleteNode(BiTree *biTree, DataType data) {
	//查找待删除的节点
	BiTreeNode *targetNode, *x, *y;

	targetNode = search(biTree, data);
	if (targetNode == NULL) return;
	//找出真正的删除节点,如果目标节点最多只有一个子树,则其为真正删除的节点
	//否则其后继节点(最多只有一个子树,想想为什么)为真正删除的节点,然后将后继节点的值赋给目标节点
	if (targetNode->left == NULL || targetNode->right == NULL) {
		y = targetNode;
	} else {
		y = successor(targetNode);
	}

	if (y->left != NULL) {
		x = y->left;
	} else {
		x = y->right;
	}

	if (x != NULL) {
		x->parent = y->parent;
	}

	//如果y是根节点, 则根节点变为x
	if (y->parent == NULL) {
		*biTree = x;
	} else {
		if (y->parent->right == y) {
			y->parent->right = x;
		} else {
			y->parent->left = x;
		}
	}

	if (y != targetNode) {
		targetNode->data = y->data;
	}
	//释放y占有的空间
	free(y);
}
//中序遍历二叉树
void inorderTraversal(BiTree *biTree, void (*visitor)(BiTreeNode *node)) {
	BiTreeNode *curNode;

	curNode = *biTree;
	if (curNode != NULL) {
		//遍历左子树
		inorderTraversal(&(curNode->left), visitor);
		//访问节点
		visitor(curNode);
		//遍历右子树
		inorderTraversal(&(curNode->right), visitor);
	}
}
#include <stdio.h>
#include <stdlib.h>
#include "biTree.h"
#define N  10
void printNode(BiTreeNode *node);

int main(int argc, char *argv[]) {
	BiTreeNode *root;
	int i;

	root = NULL;
	int data[N] = {10, 23, 11, 98, 111, 87, 34, 11, 33, 8};
	for (i = 0; i < N; i++) {
		insertNode(&root, data[i]);
	}
	printf("before delete:\n");
	inorderTraversal(&root, printNode);
	printf("\n");
	deleteNode(&root, 11);
	deleteNode(&root, 8);
	printf("after delete:\n");
	inorderTraversal(&root, printNode);
	printf("\n");
	exit(0);
}
void printNode(BiTreeNode *node) {
	printf("%d\t", node->data);
}

二叉查找树优化

  虽然二叉排序树的最坏效率是O(n),但它支持动态查询,且有很多改进版的二叉排序树可以使树高为O(logn):

  1. Size Balanced Tree(SBT)
  2. AVL树
  3. 红黑树(红黑树系列文章)
  4. Treap(Tree+Heap)

这些均可以使查找树的高度为

后续再更!

时间: 2024-11-01 19:18:48

排序算法系列之二叉查找树的相关文章

排序算法系列之堆排序

   堆排序(Heapsort)是指利用堆这种数据结构所设计的一种排序算法.堆积是一个近似完全二叉树的结构,并同时满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点. 1 堆排序定义     n个关键字序列Kl,K2,-,Kn称为堆,当且仅当该序列满足如下性质(简称为堆性质):    (1) ki≤K2i且ki≤K2i+1 或(2)Ki≥K2i且ki≥K2i+1(1≤i≤  )    若将此序列所存储的向量R[1..n]看做是一棵完全二叉树的存储结构,则堆实质上是满足如下性质的完

排序算法系列之希尔排序

算法排序之希尔排序 希尔排序,也称递减增量排序算法,是插入排序的一种高速而稳定的改进版本.  基本思想    先取一个小于n的整数d1作为第一个增量,把文件的全部记录分成d1个组.所有距离为dl的倍数的记录放在同一个组中.先在各组内进行直接插人排序:然后,取第二个增量d2<d1重复上述的分组和排序,直至所取的增量dt=1(dt<dt-l<-<d2<d1),即所有记录放在同一组中进行直接插入排序为止. 希尔排序的时间性能优于直接插入排序的原因: ①当文件初态基本有序时直接插入排

排序算法系列之合并排序

       归并排序(Merge sort,合并排序)是建立在归并操作上的一种有效的排序算法.该算法是采用分治法(Divide and Conquer)的一个非常典型的应用. 一 归并操作 基本思想     归并操作(merge),指的是将两个已经排序的序列合并成一个序列的操作,归并排序算法依赖归并操作. 归并操作的过程如下: 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列 设定两个指针,最初位置分别为两个已经排序序列的起始位置 比较两个指针所指向的元素,选择相对小的元素

排序算法系列之选择排序

简单选择排序也是直接选择排序 基本思想     选择排序(Selection sort)是一种简单直观的排序算法.它的工作原理如下.首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾.以此类推,直到所有元素均排序完毕. 排序过程:     对于一组关键字{K1,K2,-,Kn}, 首先从K1,K2,-,Kn中选择最小值,假如它是 Kz,则将Kz与 K1对换:然后从K2,K3,- ,Kn中选择最小值 Kz,再将

[算法系列之六]二叉查找树

[简介] 二叉查找树是一种数据结构,它支持多种动态集合操作. 在二叉查找树上执行的基本操作的时间与树的高度成正比.对于一棵含有n个节点的完全二叉树,这些操作的最坏情况运行时间为O(n). [结构体] 一棵二叉查找树按二叉树结构来组织的. // 二叉查找树节点 struct TreeNode { int val; TreeNode *left; TreeNode *right; TreeNode *parent; TreeNode(int x) : val(x), left(NULL), righ

排序算法系列之冒泡排序

    交换排序的基本思想是:两两比较待排序记录的关键字,发现两个记录的次序相反时即进行交换,直到没有反序的记录为止.应用交换排序基本思想的主要排序方法有:冒泡排序和快速排序. 基本思想 1.冒泡排序算法的过程: 比较相邻的元素.如果第一个比第二个大,就交换他们两个. 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对.在这一点,最后的元素应该会是最大的数. 针对所有的元素重复以上的步骤,除了最后一个. 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较. 2.以数组R

排序算法系列之插入排序

算法排序之插入排序 基本思想 一般来说,插入排序都采用in-place在数组上实现.具体算法描述如下: 从第一个元素开始,该元素可以认为已经被排序 取出下一个元素,在已经排序的元素序列中从后向前扫描 如果该元素(已排序)大于新元素,将该元素移到下一位置 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置 将新元素插入到该位置后 重复步骤2~5 伪码描述: INSERTION-SORT(A) 1 for j = 2 to length[A] 2     do key = A[j] 3    

数据结构与算法系列(2)基础排序算法

前言 在计算机中实现存储数据最普遍的两种操作就是排序和查找.这是从计算机产业初始就已经确认的 了.这意味着排序和查找也是计算机科学领域最值得研究的两种操作.本书提到的许 多数据结构的主要设计目的就是为了使排序和/或查找更加简单,同时也是为了数据在结构内的存 储更加有效. 本章会介绍有关数据排序和查找的基础算法.这些算法仅依赖数组作为数据结构,而且所采用的 "高级"编程技术只是递归.本章还介绍了用来非正式分析不同算法之间速度与效率的方 法,此方法贯穿全书. 1.排序算法 人们在日常生活中

各种排序算法汇总

目录 简介 交换排序 冒泡排序 快速排序 插入排序 直接插入排序 希尔排序 选择排序 简单选择排序 堆排序 归并排序 基数排序 总结 简介 排序是计算机内经常进行的一种操作,其目的是将一组"无序"的记录序列调整为"有序"的记录序列.分内部排序和外部排序.若整个排序过程不需要访问外存便能完成,则称此类排序问题为内部排序.反之,若参加排序的记录数量很大,整个序列的排序过程不可能在内存中完成,则称此类排序问题为外部排序.内部排序的过程是一个逐步扩大记录的有序序列长度的过程