基础知识
https://zhuanlan.zhihu.com/p/74141967
在计算机科学中,树(英语:tree)是一种抽象数据类型(ADT)或是实现这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>0)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:
- 每个节点都只有有限个子节点或无子节点;
- 没有父节点的节点称为根节点;
- 每一个非根节点有且只有一个父节点;
- 除了根节点外,每个子节点可以分为多个不相交的子树;
- 树里面没有环路(cycle)
为什么需要树?
对于大量的输入数据,链表的线性访问时间太慢,而树大部分操作的运行时间平均为O(logN)。
因为它结合了另外两种数据结构的优点: 一种是有序数组,另一种是链表。在树中查找数据项的速度和在有序数组中查找一样快, 并且插入数据项和删除数据项的速度也和链表一样。
有序数组:插入数据项太慢
假设数组中的所有数据项都有序的排列—这就是有序数组,用二分查找法可以在有序数组中快速地查找特定的值。
二分查找法的过程是先査看数组的正中间的数据项,如果那个数据项值比要找的大,就缩小査找范围,在数组的后半段中找;如果小, 就在前半段找。反复这个过程,查找数据所需的时间是O(logN)。同时也可以迅速地遍历有序数组, 按顺序访问每个数据项。
然而,想在有序数组中插入一个新数据项,就必须首先査找新数据项插入的位置,然后把所有 比新数据项大的数据项向后移动一位,来给新数据项腾出空间。这样多次的移动很费时,平均来讲 要移动数组中一半的数据项(N/2次移动)。
删除数据项也需要多次的移动,所以也很慢。 显而易见,如果要做很多的插入和删除操作,就不该选用有序数组。
链表:查找太慢
链表的插入和删除操作都很快。它们只需要改变一些引用的值就行了。这些操作的时间复杂度是0(1)(是大O表示法中最小的时间复杂度)。
但是在链表中查找数据项可不那么容易。查找必须从头开始,依次访问链表中的每一个数据项,把每个数据项的值和要找的数据项做比较,直到找到该数据项为止,平均需要访问N/2个数据项。这个过程很慢,费时O(N)(注意,对排序来说比较快的,对数据结构操作来说是比较慢的。)。
我们可以通过有序的链表来加快查找速度,链表中的数据项是有序的,但这样做是没有用的。即使是有序的链表还是必须从头开始依次访问数据项,因为链表中不能直接访问某个数据项,必须通过数据项间的链式引用才可以。(当然有序链表访问节点还是比无序链表快多了,但查找任意的数据项时它也无能为力了。)
术语
- 节点的度:一个节点含有的子树的个数称为该节点的度;
- 树的度:一棵树中,最大的节点度称为树的度;
- 叶节点或终端节点:度为零的节点;
- 非终端节点或分支节点:度不为零的节点;
- 父亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点;
- 孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点;
- 兄弟节点:具有相同父节点的节点互称为兄弟节点;
- 节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
- 深度:对于任意节点n,n的深度为从根到n的唯一路径长,根的深度为0;
- 高度:对于任意节点n,n的高度为从n到一片树叶的最长路径长,所有树叶的高度为0;
- 堂兄弟节点:父节点在同一层的节点互为堂兄弟;
- 节点的祖先:从根到该节点所经分支上的所有节点;
- 子孙:以某节点为根的子树中任一节点都称为该节点的子孙。
- 森林:由m(m>=0)棵互不相交的树的集合称为森林;
树的种类
- 无序树:树中任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树;
- 有序树:树中任意节点的子节点之间有顺序关系,这种树称为有序树;
- 二叉树:每个节点最多含有两个子树的树称为二叉树;
- 完全二叉树:对于一颗二叉树,假设其深度为d(d>1)。除了第d层外,其它各层的节点数目均已达最大值,且第d层所有节点从左向右连续地紧密排列,这样的二叉树被称为完全二叉树;
- 满二叉树:所有叶节点都在最底层的完全二叉树;
- 平衡二叉树(AVL树):当且仅当任何节点的两棵子树的高度差不大于1的二叉树;
- 排序二叉树(二叉查找树(英语:Binary Search Tree)):也称二叉搜索树、有序二叉树;
- 霍夫曼树:带权路径最短的二叉树称为哈夫曼树或最优二叉树;
- B树:一种对读写操作进行优化的自平衡的二叉查找树,能够保持数据有序,拥有多于两个子树。
树的抽象(ADT)
树作为一种抽象的数据类型,至少要支持以下的基本方法
方法名 | 描述 |
---|---|
getElement() | 返回存放于当前节点处的对象 |
setElement(e) | 将对象 e 存入当前节点,并返回其中此前所存的内容 |
getParent() | 返回当前节点的父节点 |
getFirstChild() | 返回当前节点的长子 |
getNextSibling() | 返回当前节点的最大弟弟 |
树的实现
数组实现
树可以使用数组实现,节点在数组中的位置对应于它在树中的位置。下标为0的节点是根,下标为1的节点是根的左子节点,依次类推,按从左到右的顺序存储树的每一层。
树中的每个位置,无论是否存在节点,都对应数组中的一个位置。把节点插入树的一个位置, 意味着要在数组的相应位置插入一个数据项。树中没有节点的位置在数组中的对应位置用0或null来表示。
基于这种思想,找节点的子节点和父节点可以利用简单的算术计算它们在数组中的索引值。设节点索引值为 ,则节点的左子节点是:
,它的右子节点是
,它的父节点是
大多数情况下用数组表示树不是很有效率。不满的节点和删除掉的节点在数组中留下了洞,浪费存储空间。更坏的是,删除节点时需要移动子树的话,子树中的每个节点都要移到数组中新的位置去,这在比较大的树中是很费时的。
不过,如果不允许删除操作,数组表示可能会很有用。
链表实现
public interface Tree {
Object getElem();
Object setElem(Object obj);
TreeLinkedList getParent();
TreeLinkedList getFirstChild();
TreeLinkedList getNextSibling();
int getSize();
int getHeight();
int getDepth();
}
对应实现
public class TreeLinkedList implements Tree {
private Object element;
private TreeLinkedList parent, firstChild, nextSibling;
public TreeLinkedList() {
this(null, null, null, null);
}
public TreeLinkedList(Object object, TreeLinkedList parent, TreeLinkedList firstChild, TreeLinkedList nextSibling) {
this.element = object;
this.parent = parent;
this.firstChild = firstChild;
this.nextSibling = nextSibling;
}
@Override
public Object getElem() {
return element;
}
@Override
public Object setElem(Object obj) {
Object bak = element;
element = obj;
return bak;
}
@Override
public TreeLinkedList getParent() {
return parent;
}
@Override
public TreeLinkedList getFirstChild() {
return firstChild;
}
@Override
public TreeLinkedList getNextSibling() {
return nextSibling;
}
@Override
public int getSize() {
int size = 1;
TreeLinkedList subtree = firstChild;
while (null != subtree) {
size += subtree.getSize();
subtree = subtree.getNextSibling();
}
return size;
}
@Override
public int getHeight() {
int height = -1;
TreeLinkedList subtree = firstChild;
while (null != subtree) {
height = Math.max(height, subtree.getHeight());
subtree = subtree.getNextSibling();
}
return height + 1;
}
@Override
public int getDepth() {
int depth = 0;
TreeLinkedList p = parent;
while (null != p) {
depth++;
p = p.getParent();
}
return depth;
}
}
树的遍历
所谓树的遍历(Traversal),就是按照某种次序访问树中的节点,且每个节点恰好访问一次。
也就是说,按照被访问的次序,可以得到由树中所有节点排成的一个序列。
前序遍历
对任一(子)树的前序遍历,将首先访问其根节点,然后再递归地对其下的各棵子树进行前序遍历。对于同一根节点下的各棵子树,遍历的次序通常是任意的;但若换成有序树,则可以按照兄弟间相应的次序对它们实施遍历。由前序遍历生成的节点序列,称作前序遍历序列。
后续遍历
对称地,对任一(子)树的后序遍历将首先递归地对根节点下的各棵子树进行后序遍历,最后才访问根节点。由后序遍历生成的节点序列,称作后序遍历序列。
层次遍历
除了上述两种最常见的遍历算法,还有其它一些遍历算法,层次遍历(Traversal by level )算法就是其中的一种。在这种遍历中,各节点被访问的次序取决于它们各自的深度,其策略可以总结为“深度小的节点优先访问”。
对于同一深度的节点,访问的次序可以是随机的,通常取决于它们的存储次序,即首先访问由firstChild指定的长子,然后根据nextSibling确定后续节点的次序。当然,若是有序树,则同深度节点的访问次序将与有序树确定的次序一致。
二叉树
详细了解二叉树及重建二叉树https://blog.csdn.net/qq_25333681/article/details/92802073
每个节点都不能有多于两个的儿子
class BinaryNode{
Object element; // The data in the node
BinaryNode left; // Left child
BinaryNode right; // right child
}
二叉树的实现
public class BinaryTree {
public BinaryTree left;
public BinaryTree right;
public String value;
public BinaryTree(String value) {
this(null,null,value);
}
public BinaryTree(BinaryTree left, BinaryTree right, String value) {
this.left = left;
this.right = right;
this.value = value;
}
public void insertLeft(BinaryTree currentNode, String value){
if(currentNode==null){
return;
}
BinaryTree newLeftNode = new BinaryTree(value);
if(currentNode.left!=null){
newLeftNode.left = currentNode.left;
}
currentNode.left = newLeftNode;
}
public void insertRight(BinaryTree currentNode, String value){
if(currentNode==null){
return;
}
BinaryTree newRightNode = new BinaryTree(value);
if(currentNode.right!=null){
newRightNode.right = currentNode.right;
}
currentNode.right = newRightNode;
}
}
二叉树的遍历
前序遍历
中序遍历
后序遍历
深度优先
广度优先
表达式树
表达式二叉树:存储表达式的二叉树。
如:45+2356/2-5(例子来源:https://www.cnblogs.com/yuxiuyan/p/5753006.html)
首先取出第一个数字45放在叶子节点,遇到“+”后将其放到分支节点,fig1.构建过程1
然后将“23”、“”、“56”、“/”、“2”依次放入,fig2.构建过程2
最后放入“-”、“5”,fig3.构建过程3
构建步骤
- 1.创建节点对象;
- 2.辨析出操作符与数据,存放在相应的数组队列(类型为BinaryNode)中;
- 3.取出前两个数字和一个操作符,组成一个新的数字节点;
- 4.重复第3步,直到操作符取完为止;
- 5.让根节点等于最后一个节点。
构建
1.1 节点类
节点类包括三个参数:
private String data;
private BinaryNode left;
private BinaryNode right;
方法包括:
有参构造方法:在创建时必须初始化data
public BinaryNode(String data) {
this.data = data;
}
参数的set、get方法:
构建节点时,需要set其左右子树;
遍历二叉树时,需要get其左右子树、以及get其data。
二叉树类
package com.java8.binarytree;
import java.util.ArrayList;
import java.util.Stack;
/**
* 二叉树类
* 拥有属性为root,其构建后为数的根节点
*/
public class BinaryTree {
//根节点
private BinaryNode root = new BinaryNode(null);
public BinaryNode getRoot() {
return root;
}
//—————————————————————————————————创建 和 输出 1 ———————————————————————————————————————
/**
* 创建表达式二叉树
* @param str :输入为字符串
*/
public void build(String str) {
// numbers存储数字和节点,operations存储运算符号
// binaryNode用于构建数,snum用于接受个位十位百位数字
ArrayList<BinaryNode> numbers = new ArrayList<>();
ArrayList<BinaryNode> operations = new ArrayList<>();
BinaryNode binaryNode;
String snum = "";
//1.遍历str,找出所有的运算符和数字,存入numbers和operations数组队列
for (int i = 0; i < str.length(); i++) {
//1.1 取出字符串的各个字符
char ch = str.charAt(i);
//1.2 判断为符号还是数字,若为数字,则将s+=ch(防止数字为十位百位数)
if (ch >= '0' && ch <= '9') {
snum += ch + "";
}
//1.3 若为运算符,则将s和ch分别放入numbers、operations数组队列
else {
numbers.add(new BinaryNode(snum));
operations.add(new BinaryNode(ch + " "));
snum = "";
}
}
//1.4 将最后一位数字放入numbers数组队列
numbers.add(new BinaryNode(snum));
//2. 循环构建树,直至operations队列为空结束
while(!operations.isEmpty()) {
// 2.1从运算符中取出第一个作为node的数据;
binaryNode = operations.get(0);
operations.remove(0);
//2.2从数字取出第一个、第二个作为左、右;
binaryNode.setLeft(numbers.get(0));
binaryNode.setRight(numbers.get(1));
numbers.remove(0);
numbers.remove(0);
//2.3构建node,将其作为根节点root放回数字列表
root = binaryNode;
numbers.add(0, binaryNode);
}
}
/**
* 选择方式遍历输出表达式二叉树
* @param i:1——先序 2——中序 3——后序
*/
public void output(int i) {
switch (i) {
case 1:
System.out.println("输出——先序遍历:");
preOrder(root);
System.out.println("");
break;
case 2:
System.out.println("输出——中序遍历:");
midOrder(root);
System.out.println("");
break;
case 3:
System.out.println("输出——后序遍历:");
posOrder(root);
System.out.println("");
break;
}
}
//—————————————————————————————————遍历 3———————————————————————————————————————
/**
* 递归方法 —— 前序遍历的规则:
* (1)访问根节点
* (2)前序遍历左子树
* (3)前序遍历右子树
*/
public void preOrder(BinaryNode node) {
if (node != null) {
System.out.print(node.getData() + " ");
preOrder(node.getLeft());
preOrder(node.getRight());
}
}
/**
* 递归方法 —— 中序遍历的规则:
* (1)中序遍历左子树
* (2)访问根节点
* (3)中序遍历右子树
*/
public void midOrder(BinaryNode node) {
if (node != null) {
midOrder(node.getLeft());
System.out.print(node.getData() + " ");
midOrder(node.getRight());
}
}
/**
* 递归方法 —— 后序遍历的规则:
* (1)后序遍历左子树
* (2)后序遍历右子树
* (3)访问根节点
*/
public void posOrder(BinaryNode node) {
if (node != null) {
posOrder(node.getLeft());
posOrder(node.getRight());
System.out.print(node.getData() + " ");
}
}
/**
* 非递归方法 —— 前序遍历的规则:
* (1)访问根节点
* (2)前序遍历左子树
* (3)前序遍历右子树
*/
public void preOrder2() {
BinaryNode node = root;
Stack<BinaryNode> stack = new Stack<>();
ArrayList<String> preList = new ArrayList<>();
while (node != null || stack.size() != 0) {
while (node != null) {
stack.push(node);
preList.add(node.getData());
node = node.getLeft();
}
if (stack.size() != 0) {
node = stack.pop();
node = node.getRight();
}
}
System.out.println("非递归——先序遍历:" + preList.toString());
}
/**
* 非递归方法 —— 中序遍历的规则:
* (1)中序遍历左子树
* (2)访问根节点
* (3)中序遍历右子树
*/
public void midOrder2() {
Stack<BinaryNode> stack = new Stack<>();
ArrayList<String> midList = new ArrayList<>();
BinaryNode node = root;
while (node != null || stack.size() != 0) {
while (node != null) {
stack.push(node);
node = node.getLeft();
}
if (stack.size() != 0) {
node = stack.pop();
midList.add(node.getData());
node = node.getRight();
}
}
System.out.println("非递归——中序遍历: " + midList.toString());
}
//—————————————————————————————————测试 2———————————————————————————————————————
/**
* 输出检验函数,查看numbers和operations是否已经存入数据
* @param list:Node列表
*/
public void printList(ArrayList<BinaryNode> list) {
for (int i = 0; i < list.size(); i++) {
System.out.print(list.get(i));
System.out.print(" ");
}
}
/**
* 输出检验函数,Stack是否已经存入数据
* @param list:Node列表
*/
public void printList(Stack<BinaryNode> list) {
for (int i = 0; i < list.size(); i++) {
System.out.print(list.get(i).getData());
System.out.print(" ");
}
}
}
遍历
遍历方式
例子:45+2356/2-5
先序遍历:- / + 45 23 56 2 5
/
递归方法 —— 前序遍历的规则:
(1)访问根节点
(2)前序遍历左子树
(3)前序遍历右子树
/
中序遍历:45 + 23 56 / 2 - 5
/
递归方法 —— 中序遍历的规则:
(1)中序遍历左子树
(2)访问根节点
(3)中序遍历右子树
/
后序遍历:45 23 + 56 2 / 5 -
/*
递归方法 —— 后序遍历的规则:
(1)后序遍历左子树
(2)后序遍历右子树
(3)访问根节点
/
代码:
测试类
package com.java8.binarytree;
public class Manage {
public static void main(String[] args) {
//创建binaryTree对象,其初始包含data为null的root节点
BinaryTree binaryTree = new BinaryTree();
//build二叉树时,需要输入表达式的String
binaryTree.build("45+23*56/2-5");
//查看是否构建完成,获取现在的root节点
System.out.println("二叉树的root为: "+binaryTree.getRoot().getData());
binaryTree.output(1);
binaryTree.output(2);
binaryTree.output(3);
}
}
二叉查找树
使二叉树成为二叉查找树的性质是,对于树中的每个节点X,它的左子树中所有项的值小于X中的项,而它的右子树中所有项的值大于X中的项。
二叉查找树的平均深度为O(logN),一般不必担心栈空间被耗尽