排序算法之堆排序

来源:互联网 发布:业绩数据分析 编辑:程序博客网 时间:2024/05/22 14:07

堆的定义

堆实际上是一棵完全二叉树。分大顶堆和小顶堆
每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆
每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆

算法
大顶堆:arr[i] >= arr[2i+1] && arr[i] >= arr[2i+2]
小顶堆:arr[i] <= arr[2i+1] && arr[i] <= arr[2i+2]

如图

这里写图片描述

一般用数组来表示堆
根结点在角标0处
i结点的父结点下标就为(i-1)/2
i结点的左子结点下标为2*i+1
i结点的右子结点下标为2*i+2

如图

这里写图片描述

二叉树
所有的分支结点都存在左子树和右子树,并且所有的叶子结点都在同一层上称为满二叉树
除最后一层外,每一层上的结点数均达到最大值,且最后一层叶子结点一定集中在左部连续位置称为完全二叉树

如图
这里写图片描述

堆排序

堆排序是一种利用堆的性质的树形选择排序。

堆排序工作原理

第一步:构造初始堆。将给定无序序列构造成一个大顶堆(一般升序采用大顶堆,降序采用小顶堆)

第二步:将堆顶元素与末尾元素进行交换,使末尾元素最大。然后将剩余n-1个元素重新调整成一个大顶堆,再将堆顶元素与末尾元素交换,得到第二大元素…如此反复执行调整、交换,只到整个序列有序

堆排序实例步骤

第一步:建立无序序列初始堆结构图
这里写图片描述

第二步:从第一个非叶子结点从下至上,从右至左调整结构(第一个非叶子结点角标 arr.length/2-1=6/2-1=2,也就是下面角标为2的结点3)

因非叶子结点3只有一个叶子结点4,所以只需要比较3和4的大小,3<4则3与4进行位置交换,如图

这里写图片描述

第三步:再从倒数第二个非叶子结点从下至上,从右至左调整结构(倒数第二个非叶子结点角标 arr.length/2-1=6/2-1-1=1,也就是下面角标为1的结点7)

因非叶子结点7有两个叶子结点8、5。所以需要先比较8、5的大小,8>5然后再拿8与7比较,8>7则8与7进行位置交换,如图

这里写图片描述

第四步:再从倒数第三个非叶子结点从下至上,从右至左调整结构(倒数第三个非叶子结点角标 arr.length/2-1=6/2-1-1-1=0,也就是下面角标为0的结点2)

因非叶子结点2有两个叶子结点8、4。所以需要先比较8、4的大小,8>4然后再拿8与2比较,8>2则先跟新角标0的值为8,先临时记住2这个值,因角标1有两个叶子结点,所以角标1的值先不变,先比较出角标1的两个叶子结点较大值为7,再拿7与临时记住的2这个值比较,7>2所以最终2赋值到角标3上,7赋值到角标1上,如图

这里写图片描述

此时将一个无需序列构造成了一个大顶堆,即每个结点的值都大于或等于其左右孩子结点的值

第五步:将堆顶元素与末尾元素进行交换,使末尾元素最大,如图

这里写图片描述

第六步:将剩余n-1个元素重新调整成一个大顶堆,再将堆顶元素与末尾元素交换,得到第二大元素…如此反复执行调整、交换,只到整个序列有序,如图

这里写图片描述

这里写图片描述

Java代码

public class HeapSort {    public static void main(String[] args) {        int[] arr = {2, 7, 3, 8, 5, 4};        sort(arr);        System.out.println("排序后结果是");        System.out.println(Arrays.toString(arr));    }    public static void sort(int[] arr) {        //1.构建大顶堆        for (int i = arr.length / 2 - 1; i >= 0; i--) {            //从第一个非叶子结点从下至上,从右至左调整结构            adjustHeap(arr, i, arr.length);        }        //2.调整堆结构+交换堆顶元素与末尾元素        for (int j = arr.length - 1; j > 0; j--) {            swap(arr, 0, j);//将堆顶元素与末尾元素进行交换            adjustHeap(arr, 0, j);//重新对堆进行调整            System.out.println(Arrays.toString(arr));        }    }    /**     * 调整大顶堆     */    public static void adjustHeap(int[] arr, int i, int length) {        int temp = arr[i];//先取出当前元素i        for (int k = i * 2 + 1; k < length; k = k * 2 + 1) {//从i结点的左子结点开始,也就是2i+1处开始            //k+1<length 防止角标越界            //arr[k]<arr[k+1] 如果左子结点小于右子结点,k指向右子结点            if (k + 1 < length && arr[k] < arr[k + 1]) {                k++;            }            //如果子节点大于父节点,将子节点值赋给父节点(子节点值先不变,直到循环完毕后才赋值)            if (arr[k] > temp) {                arr[i] = arr[k];                i = k;//记录最新最小坐标,用于交换值            } else {                break;            }        }        arr[i] = temp;//i值已经变成k值,把最小值放到最下边    }    /**     * 交换元素     */    public static void swap(int[] arr, int a, int b) {        int temp = arr[a];        arr[a] = arr[b];        arr[b] = temp;    }}

打印结果

[7, 5, 4, 2, 3, 8][5, 3, 4, 2, 7, 8][4, 3, 2, 5, 7, 8][3, 2, 4, 5, 7, 8][2, 3, 4, 5, 7, 8]排序后结果是[2, 3, 4, 5, 7, 8]

算法分析

时间复杂度
堆排序的时间复杂度为O(nlogn)。由于堆排序对原始记录的排序状态并不敏感,因此它无论是最好、最坏和平均时间复杂度均为O(nlogn)。

空间复杂度
堆排序仅需一个记录大小的供交换用的辅助存储空间。

稳定性
由于记录的比较与交换是跳跃式进行,因此堆排序是一种不稳定的排序算法。