vlambda博客
学习文章列表

桶排序、计数排序和基数排序比较分析

一、桶排序

1. 算法思想:桶排序是将待排序序列中处于相同值域的元素存入同一个桶中,即将一个数据表分割成许多桶,然后每个桶中的元素各自排序。它采用分治策略,是一种分布式的排序方法。


2. 算法过程:

(1)根据待排序序列中最大元素和最小元素的差值和映射规则,确定申请的桶个数;

(2)遍历待排序序列,将每一个元素存储到对应的桶中;

(3)分别对每一个桶中元素进行排序,并存储到原序列中,获得一个已排序序列。


3. 图例分析:

待排序序列为:[29, 25, 3, 49, 9, 37, 21, 43],以间隔大小10来区分不同值域,待申请桶的个数为5。


4. 代码演示:

def bucket_sort(a:list)->list: step = 10 #以间隔大小10来区分不同值域 maximum, minimum = max(a), min(a) buckets = [[] for i in range(maximum //step - minimum // step + 1)] #桶的数量 for i in a: #将处于相同值域(即index相同)的元素存入同一个桶中 index = i // step - minimum // step buckets[index].append(i)    a.clear() for b in buckets: b.sort() #对每一个桶中元素进行排序 a.extend(b) #将各个桶的元素按顺序存储到原序列中 return a


二、简单计数排序

1. 算法思想:若待排序序列的元素均为非负整数,且最大值为maximum,则分配maximum+1个桶,每个桶的编号(下标)就等于待排序元素的值,每个桶的元素值就是存入桶中的待排序元素个数。为了描述方便,我们将桶序列称为统计数组。


2. 算法过程:

(1)根据待排序序列中最大元素值,确定申请的桶个数,并将桶全部清空;

(2)统计待排序序列中每个值为i的元素出现的次数,存入编号为i的桶;

(3)依次把数据从桶里倒出来,存储到原序列中,获得一个已排序序列。


3. 图例分析:

待排序序列为:[3, 5, 1, 0, 3, 0],待申请桶的个数为5+1=6。

数组下标

index

0

1

2

3

4

5

待排序数组

a

3

5

1

0

3

0

统计数组

c

2

1

0

2

0

1

倒回原数组

a

0

0

1

3

3

5


4. 代码演示:

def counting_sort(a:list)->list: maximum, minimum = max(a), min(a) c = [0] * (maximum - minimum + 1) #将所有的桶均清空 for i in a:#将值为i的元素存入下标为i桶中 c[i] += 1 for i in range(1, len(c)): #依次求出每个桶的前缀和 c[i] += c[i-1] b = [0] * (maximum - minimum + 1)#设置目标数组 for i in a[::-1]: #反向填充目标数组 c[i] -= 1 b[c[i]] = i return b


三、优化计数排序

        简单计数排序有两个缺陷,一是根据最大元素值来确定桶的数量,完全不考虑最小元素值,当最小值也很大时会造成空间浪费。二是统计数组中的桶相当于一个“栈”数据结构,具有“先进后出”特征,如果我们直接按顺序把数据从桶里倒出来,存储到原数组a中,就会改变数组a中等值元素的相对位置,造成“不稳定排序”的后果。

        下面我们对这两个缺陷进行改进。

1. 算法思想:对于待排序序列中的每一个元素x,确定该序列中值小于x的元素的个数。一旦有了这个信息,就可以将x直接存放到最终的输出序列的正确位置上。它相当于桶排序中step=1的一个特例,因此它需要创建桶的数量为maximum - minimum + 1,每个桶的编号(下标)就等于待排序元素的值,每个桶的元素值就是存入桶中的待排序元素个数。为了描述方便,我们将桶序列称为统计数组。


2. 算法过程:

(1)根据待排序序列中最大元素和最小元素的差值,确定申请桶的个数,并将桶全部清空;

(2)统计待排序序列中每个值为i的元素出现的次数,存入编号为i的桶;

(3)依次求出每个桶的前缀和;

(4)反向填充目标数组,每放一个元素就将对应桶的元素值减一。


3. 图例分析:

待排序序列为:[3, 5, 1, 0, 3, 0],待申请桶的个数为5-0+1=6。

数组下标

index

0

1

2

3

4

5

待排序数组

a

3

5

1

0

3

0

统计数组

c

2

1

0

2

0

1

对c求前缀和

c

2

3

3

5

5

6

反向填充数组

b


0





i=5

c

1

3

3

5

5

6

反向填充数组

b


0



3


i=4

c

1

3

3

4

5

6

反向填充数组

b

0

0



3


i=3

c

0

3

3

4

5

6

反向填充数组

b

0

0

1


3


i=2

c

0

2

3

4

5

6

反向填充数组

b

0

0

1


3

5

i=1

c

0

2

3

4

5

5

反向填充数组

b

0

0

1

3

3

5

i=0

c

0

2

3

3

5

5


4. 代码演示:

def counting_sort2(a:list)->list: maximum, minimum = max(a), min(a) c = [0] * (maximum - minimum + 1) #将所有的桶均清空 for i in a: #将值为i的元素存入下标为i桶中 c[i-minimum] += 1 for i in range(1, len(c)): #依次求出每个桶的前缀和 c[i] += c[i-1] b = [0] * len(a)#设置目标数组 for i in a[::-1]: #反向填充目标数组 c[i-minimum] -= 1 b[c[i-minimum]] = i return b


四、基数排序

1. 算法思想:基数排序又称为“桶子法”,从低位开始将待排序的数按照这一位的值放到相应的编号为0~9的桶中。等到低位排完得到一个子序列,再将这个序列按照次低位的大小进入相应的桶中,一直排到最高位为止,数组排序完成。


2.  算法过程:

(1)将所有待比较数值统一为同样的数位长度,数位较短的数前面补零;

(2)从最低位开始,依次进行一次桶排序;

(3)从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。


3. 图例分析:

待排序序列为:[53, 3, 542, 748, 14, 214, 154, 63, 616],数位长度为3。


4. 代码演示:

def radix_sort(a:list)->list: def cout_sort(a:list, exp:int): c = [0] * 10 for i in a: c[(i//exp)%10] += 1 for i in range(1, len(c)): #依次求出每个桶的前缀和 c[i] += c[i-1] t = a[::-1] #将原数组逆序复制到临时数组t for i in t: #反向填充目标数组 c[(i//exp)%10] -= 1 a[c[(i//exp)%10]] = i
exp, m = 1, max(a) while m // exp > 0: cout_sort(a, exp) exp *= 10 return a


相关优秀文章: