vlambda博客
学习文章列表

[排序算法总结三] 计数排序和桶排序

快排、归并、插入在相应的条件下已经很快了。但是随着计算机存储设备越来越充足,计算机存储能力也大大提高。这样不需要考虑计算机内存情况下。计数排序和桶排序进一步提高排序速度,当然也是在牺牲空间复杂度的情况下。


1

计数排序


      计数排序,不考虑存储空间的限制,用一个很大的数组(上界是待排序数据最大值)来存放数据中每个数出现的次数,然后按照从小到大输出即可,计数排序是一种不用比较的排序思想。适合数据量大而且数据分布范围较小的情况。

        实现代码:

private void countSort(int[] array , int n) { int[] data = new int[1000000]; for (int i = 0 ; i < n ; i ++) { data[array[i]]++; }
int index = 0; for (int i = 0 ; i < 1000000 ; i ++) { int num = data[i]; if (num > 0) { while (num > 0) { array[index++] = i; num--; } } } }

    计数排序时间复杂度是:O(k),这个k值就是待排序数据最大值,一般取那个值所在量级的一个整数,是一种非比较的排序算法。也是不稳定的。



2

桶排序

        

      桶排序利用计数排序思想发展而来,把数据以分布范围为划分依据放进尽可能多的桶中,桶与桶之间总体是递增的,在整个数据分布范围之内,每个桶使用快排或者其他排序进行排序。而关键就是这个桶的构造,是按照数据分布范围来构造桶。比如0-100范围内均匀分布50个数据,就构造10个桶,那么0-10的数字放进第一个桶,11-20数据放入第二个桶....91-100之内数据放入第20个桶。最后把数据全取出来即排好序了。

      桶排序要求比较高:桶尽可能的多,内存要求充分,数据都是均匀分布在几个桶中,那么得知道数据的两端上界和下界,每个桶平均有n/m数据 , 这样时间复杂度O(n + n/m * log(n/m)),当桶尽可能多时,桶个数m趋近于n时,接近于O(n),最坏情况下,数据全部分布在一个桶中,退化为O(nlogn)。

        下面代码是我自己构造桶排序的一个类:

public class BuckedSort {
public HashMap<Integer , ArrayList<Integer>> bucked; public int buckedSize;
public BuckedSort(int[] array , int n , int buckedSize) {
this.bucked = new HashMap<>(buckedSize); this.buckedSize = buckedSize; for (int i = 0 ; i < buckedSize ; i ++) bucked.put(i , new ArrayList<Integer>()); this.addBucked(array , n); this.sort(); }
public BuckedSort() { }
//把数据放入桶内 private void addBucked(int[] array , int n) { for (int i = 0 ; i < n ; i ++) { int index = array[i]/100; ArrayList<Integer> list = bucked.get(index); list.add(array[i]); bucked.put(index , list); } } //把每个桶中数组排序 private void sort() { for (int i = 0 ; i < buckedSize ; i ++) { ArrayList<Integer> list = bucked.get(i); Collections.sort(list); bucked.put(i , list); } }
//排好序后,把桶中数据放入数组中 private void addArray(int[] array , int n) { int len = 0 , index = 0; for (int i = 0 ; i < buckedSize ; i ++) { ArrayList<Integer> list = bucked.get(i);
len = list.size(); for (int j = 0 ; j < len ; j ++) { array[index++] = list.get(j); } //index += len; } }}


3

测试


        使用100000个数据测试,测试结果如下:

 //桶排序 long startTimeBuckedSort = System.nanoTime(); buckedSort.addArray(buckedArray , n); //buckedSort.printArray(array , n); long endTimeBuckedSort = System.nanoTime(); double timeBuckedSort = (endTimeBuckedSort - startTimeBuckedSort)/1000000000.0;        System.out.println("桶排序时间是:" + timeBuckedSort + "s");
//计数排序 long startTimeCountSort = System.nanoTime(); bS.countSort(countArray , n); //bS.printArray(array , n); long endTimeCountSort = System.nanoTime(); double timeCountSort = (endTimeCountSort - startTimeCountSort)/1000000000.0; System.out.println("计数排序时间是:" + timeCountSort + "s");

        因为两种一个是比较算法,一个未比较,适应场景也是不同的,时间上就没有多大可比性,但是都牺牲了空间,所以结果都很快。


                        清水河畔    垂钓人生

扫描二维码

获取更多精彩

独钓清水河