前提条件
基本概念
堆排序 (Heap Sort) 是 一 种树形选择排序,在排序过程中,将待排序的记录
r
[
l
.
.
n
]
r[l..n]
r[l..n]看成是一棵完全二叉树的顺序存储结构,利用完全二叉树中双亲结点和孩子结点之间的内在关系,在当前无序的序列中选择关键字最大(或最小)的记录。
算法步骤
建立大根堆
void HeapAdjust(SqList &L,int s,int m)
{
ElemType rc;
int j;
rc=L.r[s];
for(j=2*s;j<=m;j*=2)
{
if(j<m&&L.r[j].key<L.r[j+1].key) ++j;
if(rc.key>=L.r[j].key) break;
L.r[s]=L.r[j]; s=j;
}
L.r[s]=rc;
}
void CreatHeap(SqList &L)
{
int i,n;
n=L.length;
for(i=n/2;i>0;--i)
HeapAdjust(L,i,n);
}
堆排序
堆排序利用了大根堆(或 小根堆) 堆顶记录的关键字最大(或最小)这一特征,使得当前无序的序列中选择关键字最大(或最小) 的记录变得简单。下面讨论用大根堆进行排序,堆排序的步骤如下。
- ①按堆的定义将待排序序列r[1…n]调整为大根堆(这个过程称为建初堆),交换r[1]和r[n],则r[n]为关键字最大的记录。
- ②将r[1…n-1]重新调整为堆,交换r[1]和r[n-1],则r[n-1]为关键字次大的记录。
- ③循环n-1次,直到交换了r[1]和r[2]为止,得到了一个非递减的有序序列r[1 …n]。
void HeapSort(SqList &L)
{
int i;
ElemType x;
CreatHeap(L);
for(i=L.length;i>1;--i)
{
x=L.r[1];
L.r[1]=L.r[i];
L.r[i]=x;
HeapAdjust(L,1,i-1);
}
}
算法分析
时间复杂度
- 堆排序的运行时间主要耗费在建初堆和调整堆时进行的反复“筛选”上。
- 设有n个记录的初始序列所对应的完全二叉树的深度为h,建初堆时,每个非终端结点都要自上而下进行“筛选"。由于第i层上的结点数小于等于
2
i
?
1
2^{i-1}
2i?1,且第i层结点最大下移的深度为h-i,每下移一层要做两次比较,所以建初堆时关键字总的比较次数为
∑
i
=
h
?
1
i
2
i
?
1
?
2
(
h
?
i
)
=
∑
i
=
h
?
1
i
2
i
?
2
(
h
?
i
)
=
∑
j
=
1
h
?
1
2
h
?
j
?
j
<
=
2
n
∑
j
=
1
h
?
1
j
/
2
j
<
=
4
n
\sum\limits_{i=h-1}^i 2^{i-1}\cdot2(h-i)=\sum\limits_{i=h-1}^i 2^{i}\cdot2(h-i)=\sum\limits_{j=1}^{h-1} 2^{h-j}\cdot j<=2n\sum\limits_{j=1}^{h-1}j/2^j<=4n\quad
i=h?1∑i?2i?1?2(h?i)=i=h?1∑i?2i?2(h?i)=j=1∑h?1?2h?j?j<=2nj=1∑h?1?j/2j<=4n
调整建新堆时要做 n-1次“筛选” ,每次“筛选”都要将根结点下移到合适的位置。 n个结点的完全二叉树的深度为
└
l
o
g
2
n
┘
+
1
\llcorner log_2n\lrcorner+1
└log2?n┘+1,则重建堆时关键字总的比较次数不超过
2
(
└
l
o
g
2
(
n
?
1
)
┘
+
└
l
o
g
2
(
n
?
2
)
┘
+
.
.
.
+
└
l
o
g
2
2
┘
)
<
2
n
(
└
l
o
g
2
n
┘
)
2(\llcorner log_2(n-1)\lrcorner+\llcorner log_2(n-2)\lrcorner+...+\llcorner log_22\lrcorner)<2n(\llcorner log_2n\lrcorner)
2(└log2?(n?1)┘+└log2?(n?2)┘+...+└log2?2┘)<2n(└log2?n┘) - 由此,堆排序在最坏的情况下,其时间复杂度也为
O
(
n
l
o
g
2
n
)
O(nlog_{2}n)
O(nlog2?n)。
- 实验研究表明,平均性能接近于最坏性能。
空间复杂度
仅需一个记录大小供交换用的辅助存储空间,所以空间复杂度为O(1)。
算法特点
- (1)是不稳定排序。
- (2)只能用于顺序结构,不能用于链式结构。
- (3)初始建堆所需的比较次数较多,因此记录数较少时不宜采用。堆排序在最坏情况下时间复杂度为
O
(
n
l
o
g
2
n
)
O(nlog_{2}n)
O(nlog2?n),相对于快速排序最坏情况下的
O
(
n
2
)
O(n^2)
O(n2)而言是一个优点,当记录较多时较为高效。
完整代码
#include<stdlib.h>
#include<stdio.h>
#define MAXSIZE 20
typedef struct
{
int key;
char *otherinfo;
}ElemType;
typedef struct
{
ElemType *r;
int length;
}SqList;
void HeapAdjust(SqList &L,int s,int m)
{
ElemType rc;
int j;
rc=L.r[s];
for(j=2*s;j<=m;j*=2)
{
if(j<m&&L.r[j].key<L.r[j+1].key) ++j;
if(rc.key>=L.r[j].key) break;
L.r[s]=L.r[j]; s=j;
}
L.r[s]=rc;
}
void Create_Sq(SqList &L)
{
int i,n;
printf("请输入数据个数,不超过%d个\n",MAXSIZE);
scanf("%d",&n);
while(n>MAXSIZE)
{
printf("个数超过上限,不能超过%d,请重新输入",MAXSIZE);
scanf("%d",&n);
}
printf("请输入待排序的数据:\n");
for(i=1;i<=n;i++)
{
scanf("%d",&L.r[i].key);
L.length++;
}
}
void CreatHeap(SqList &L)
{
int i,n;
n=L.length;
for(i=n/2;i>0;--i)
HeapAdjust(L,i,n);
}
void HeapSort(SqList &L)
{
int i;
ElemType x;
CreatHeap(L);
for(i=L.length;i>1;--i)
{
x=L.r[1];
L.r[1]=L.r[i];
L.r[i]=x;
HeapAdjust(L,1,i-1);
}
}
void show(SqList L)
{
int i;
for(i=1;i<=L.length;i++)
printf("%d ",L.r[i].key);
}
int main()
{
SqList L;
L.r=(ElemType*)malloc((MAXSIZE+1)*sizeof(ElemType));
L.length=0;
Create_Sq(L);
HeapSort(L);
printf("排序后的结果为:\n");
show(L);
return 0;
}
输出结果
参考文献
[1] 严蔚敏,吴伟民. 数据结构(C语言版). 北京: 清华大学出版社,2020 [2] 严蔚敏,李冬梅,吴伟民. 数据结构(C语言版)(第二版). 北京: 人民邮电出版社,2021 [3] 吴伟民,李小妹,刘添添,黄剑锋,苏庆,林志毅,李杨.数据结构. 北京:高等教育出版社,2017 [4] 王道论坛. 2022数据结构考研复习指导. 北京:电子工业出版社,2021
|