vlambda博客
学习文章列表

你真的懂快速排序吗?

本文会深入解析快速排序算法的基本原理及快速排序的演进过程。重点解析排序算法中“基准值”问题、以及快速排序在Java实际开发中的应用。

快速排序是一种“分而治之”的排序算法,通过随机选择“分区点(基准值)”来避免出现最坏的情况。

1.随机选择“分区点”。
2.按照“分区点”的高度划条线。
3.高出“分局点”的元素需要向右移动。
4.低于“分区点”的元素需要向左移动。
5.移动元素。
6.重复上述的步骤分别对位于“分区点”两边的元素进行排序。

对于分治算法,当每次划分时,算法若都能分成两个等长的子序列时,那么分治算法效率会达到最大。也就是说,基准的选择是很重要的。选择基准的方式决定了两个分割后两个子序列的长度,进而对整个算法的效率产生决定性影响。

最理想的方法是,选择的基准恰好能把待排序序列分成两个等长的子序列,那么如何选好一个基准值呢?由此我们引出我们第一部分要讨论的内容:


  
    
    
  
  • 第一部分 择基准值的方法

方法(1):固定位置

思想:取序列的第一个或最后一个元素作为基准

基本的快速排序


  
    
    
  
  • int SelectPivot(int arr[],int low,int high)

  • {

  • return arr[low];//选择选取序列的第一个元素作为基准

  • }

注意:基本的快速排序选取第一个或最后一个元素作为基准。但是,这是一直很不好的处理方法。

测试数据:

你真的懂快速排序吗?

测试数据分析:如果输入序列是随机的,处理时间可以接受的。如果数组已经有序时,此时的分割就是一个非常不好的分割。因为每次划分只能使待排序序列减一,此时为最坏情况,快速排序沦为起泡排序,时间复杂度为Θ(n^2)。而且,输入的数据是有序或部分有序的情况是相当常见的。因此,使用第一个元素作为枢纽元是非常糟糕的,为了避免这个情况,就引入了下面两个获取基准的方法。

方法(2):随机选取基准

引入的原因:在待排序列是部分有序时,固定选取枢轴使快排效率底下,要缓解这种情况,就引入了随机选取枢轴

思想:取待排序列中任意一个元素作为基准

随机化算法


  
    
    
  
  • /*随机选择枢轴的位置,区间在low和high之间*/

  • int SelectPivotRandom(int arr[],int low,int high)

  • {

  • //产生枢轴的位置

  • srand((unsigned)time(NULL));

  • int pivotPos = rand()%(high - low) + low;


  • //把枢轴位置的元素和low位置元素互换,此时可以和普通的快排一样调用划分函数

  • swap(arr[pivotPos],arr[low]);

  • return arr[low];

  • }

测试数据:

你真的懂快速排序吗?

测试数据分析::这是一种相对安全的策略。由于枢轴的位置是随机的,那么产生的分割也不会总是会出现劣质的分割。在整个数组数字全相等时,仍然是最坏情况,时间复杂度是O(n^2)。实际上,随机化快速排序得到理论最坏情况的可能性仅为1/(2^n)。所以随机化快速排序可以对于绝大多数输入数据达到O(nlogn)的期望时间复杂度。一位前辈做出了一个精辟的总结:“随机化快速排序可以满足一个人一辈子的人品需求。”

方法(3):三数取中(median-of-three)

引入的原因:虽然随机选取枢轴时,减少出现不好分割的几率,但是还是最坏情况下还是O(n^2),要缓解这种情况,就引入了三数取中选取枢轴

分析:最佳的划分是将待排序的序列分成等长的子序列,最佳的状态我们可以使用序列的中间的值,也就是第N/2个数。可是,这很难算出来,并且会明显减慢快速排序的速度。这样的中值的估计可以通过随机选取三个元素并用它们的中值作为枢纽元而得到。事实上,随机性并没有多大的帮助,因此一般的做法是使用左端、右端和中心位置上的三个元素的中值作为枢纽元。显然使用三数中值分割法消除了预排序输入的不好情形,并且减少快排大约14%的比较次数

举例:待排序序列为:8 1 4 9 6 3 5 2 7 0

左边为:8,右边为0,中间为6.

我们这里取三个数排序后,中间那个数作为枢轴,则枢轴为6

注意:在选取中轴值时,可以从由左中右三个中选取扩大到五个元素中或者更多元素中选取,一般的,会有(2t+1)平均分区法(median-of-(2t+1),三平均分区法英文为median-of-three)。

具体思想:对待排序序列中low、mid、high三个位置上数据进行排序,取他们中间的那个数据作为枢轴,并用0下标元素存储枢轴。

即:采用三数取中,并用0下标元素存储枢轴。

/函数作用:取待排序序列中low、mid、high三个位置上数据,选取他们中间的那个数据作为枢轴/


  
    
    
  
  • int SelectPivotMedianOfThree(int arr[],int low,int high)

  • {

  • int mid = low + ((high - low) >> 1);//计算数组中间的元素的下标


  • //使用三数取中法选择枢轴

  • if (arr[mid] > arr[high])//目标: arr[mid] <= arr[high]

  • {

  • swap(arr[mid],arr[high]);

  • }

  • if (arr[low] > arr[high])//目标: arr[low] <= arr[high]

  • {

  • swap(arr[low],arr[high]);

  • }

  • if (arr[mid] > arr[low]) //目标: arr[low] >= arr[mid]

  • {

  • swap(arr[mid],arr[low]);

  • }

  • //此时,arr[mid] <= arr[low] <= arr[high]


  • return arr[low];

  • //low的位置上保存这三个位置中间的值

  • //分割时可以直接使用low位置的元素作为枢轴,而不用改变分割函数了

  • }

测试数据:

你真的懂快速排序吗?

测试数据分析:使用三数取中选择枢轴优势还是很明显的,但是还是处理不了重复数组

优化1、当待排序序列的长度分割到一定大小后,使用插入排序。

原因:对于很小和部分有序的数组,快排不如插排好。当待排序序列的长度分割到一定大小后,继续分割的效率比插入排序要差,此时可以使用插排而不是快排

截止范围:待排序序列长度N = 10,虽然在5~20之间任一截止范围都有可能产生类似的结果,这种做法也避免了一些有害的退化情形。摘自《数据结构与算法分析》Mark Allen Weiness 著


  
    
    
  
  • if (high - low + 1 < 10)

  • {

  • InsertSort(arr,low,high);

  • return;

  • }//else时,正常执行快排

测试数据:

你真的懂快速排序吗?

测试数据分析:针对随机数组,使用三数取中选择枢轴+插排,效率还是可以提高一点,真是针对已排序的数组,是没有任何用处的。因为待排序序列是已经有序的,那么每次划分只能使待排序序列减一。此时,插排是发挥不了作用的。所以这里看不到时间的减少。另外,三数取中选择枢轴+插排还是不能处理重复数组

优化2、在一次分割结束后,可以把与Key相等的元素聚在一起,继续下次分割时,不用再对与key相等元素分割

举例:

待排序序列 1 4 6 7 6 6 7 6 8 6

三数取中选取枢轴:下标为4的数6

转换后,待分割序列:6 4 6 7 1 6 7 6 8 6


  
    
    
  
  • 枢轴key:6

本次划分后,未对与key元素相等处理的结果:1 4 6 6 7 6 7 6 8 6

下次的两个子序列为:1 4 6 和 7 6 7 6 8 6

本次划分后,对与key元素相等处理的结果:1 4 6 6 6 6 6 7 8 7

下次的两个子序列为:1 4 和 7 8 7

经过对比,我们可以看出,在一次划分后,把与key相等的元素聚在一起,能减少迭代次数,效率会提高不少

具体过程:在处理过程中,会有两个步骤

第一步,在划分过程中,把与key相等元素放入数组的两端

第二步,划分结束后,把与key相等的元素移到枢轴周围

举例:

待排序序列 1 4 6 7 6 6 7 6 8 6

三数取中选取枢轴:下标为4的数6

转换后,待分割序列:6 4 6 7 1 6 7 6 8 6


  
    
    
  
  • 枢轴key:6

第一步,在划分过程中,把与key相等元素放入数组的两端
结果为:6 4 1 6(枢轴) 7 8 7 6 6 6

此时,与6相等的元素全放入在两端了

第二步,划分结束后,把与key相等的元素移到枢轴周围

结果为:1 4 66(枢轴) 6 6 6 7 8 7

此时,与6相等的元素全移到枢轴周围了

之后,在1 4 和 7 8 7两个子序列进行快排

代码


  
    
    
  
  • void QSort(int arr[],int low,int high)

  • {

  • int first = low;

  • int last = high;


  • int left = low;

  • int right = high;


  • int leftLen = 0;

  • int rightLen = 0;


  • if (high - low + 1 < 10)

  • {

  • InsertSort(arr,low,high);

  • return;

  • }


  • //一次分割

  • int key = SelectPivotMedianOfThree(arr,low,high);//使用三数取中法选择枢轴


  • while(low < high)

  • {

  • while(high > low && arr[high] >= key)

  • {

  • if (arr[high] == key)//处理相等元素

  • {

  • swap(arr[right],arr[high]);

  • right--;

  • rightLen++;

  • }

  • high--;

  • }

  • arr[low] = arr[high];

  • while(high > low && arr[low] <= key)

  • {

  • if (arr[low] == key)

  • {

  • swap(arr[left],arr[low]);

  • left++;

  • leftLen++;

  • }

  • low++;

  • }

  • arr[high] = arr[low];

  • }

  • arr[low] = key;


  • //一次快排结束

  • //把与枢轴key相同的元素移到枢轴最终位置周围

  • int i = low - 1;

  • int j = first;

  • while(j < left && arr[i] != key)

  • {

  • swap(arr[i],arr[j]);

  • i--;

  • j++;

  • }

  • i = low + 1;

  • j = last;

  • while(j > right && arr[i] != key)

  • {

  • swap(arr[i],arr[j]);

  • i++;

  • j--;

  • }

  • QSort(arr,first,low - 1 - leftLen);

  • QSort(arr,low + 1 + rightLen,last);

  • }

测试数据:

你真的懂快速排序吗?

测试数据分析:三数取中选择枢轴+插排+聚集相等元素的组合,效果竟然好的出奇。

原因:在数组中,如果有相等的元素,那么就可以减少不少冗余的划分。这点在重复数组中体现特别明显啊。

其实这里,插排的作用还是不怎么大的。

优化3:优化递归操作

快排函数在函数尾部有两次递归操作,我们可以对其使用尾递归优化

优点:如果待排序的序列划分极端不平衡,递归的深度将趋近于n,而栈的大小是很有限的,每次递归调用都会耗费一定的栈空间,函数的参数越多,每次递归耗费的空间也越多。优化后,可以缩减堆栈深度,由原来的O(n)缩减为O(logn),将会提高性能。

代码:


  
    
    
  
  • void QSort(int arr[],int low,int high)

  • {

  • int pivotPos = -1;

  • if (high - low + 1 < 10)

  • {

  • InsertSort(arr,low,high);

  • return;

  • }

  • while(low < high)

  • {

  • pivotPos = Partition(arr,low,high);

  • QSort(arr,low,pivot-1);

  • low = pivot + 1;

  • }

  • }

注意:在第一次递归后,low就没用了,此时第二次递归可以使用循环代替

测试数据:
你真的懂快速排序吗?

测试数据分析:其实这种优化编译器会自己优化,相比不使用优化的方法,时间几乎没有减少

优化4:使用并行或多线程处理子序列(略)

所有的数据测试:
你真的懂快速排序吗?

概括:这里效率最好的快排组合 是:三数取中+插排+聚集相等元素,它和STL中的Sort函数效率差不多

注意:由于测试数据不稳定,数据也仅仅反应大概的情况。如果时间上没有成倍的增加或减少,仅仅有小额变化的话,我们可以看成时间差不多。


  
    
    
  
  • 第二部分 快速排序在Java中的应用

说到Java中的快速排序,就不得不提JDK中Arrays.sort底层原理及其排序算法的选择。分析Arrays.sort初衷,是想写篇Java和算法的实际应用,让算法不再玄乎,而Arrays.sort是很好的切入点,即分析Java的排序算法的底层原理,又能学习里面的排序算法思想。
Arrays.sort并不是单一的排序,而是插入排序,快速排序,归并排序三种排序的组合,为此我画了个流程图:
你真的懂快速排序吗?

接下来点进sort方法:


  
    
    
  
  • // Use Quicksort on small arrays

  • if (right - left < QUICKSORT_THRESHOLD) {//QUICKSORT_THRESHOLD = 286

  • sort(a, left, right, true);

  • return;

  • }

数组一进来,会碰到第一个阀值QUICKSORT_THRESHOLD(286),注解上说,小过这个阀值的进入Quicksort (快速排序),其实并不全是,点进去sort(a, left, right, true);方法:


  
    
    
  
  • // Use insertion sort on tiny arrays

  • if (length < INSERTION_SORT_THRESHOLD) {

  • if (leftmost) {

  • ......

点进去后我们看到第二个阀值INSERTION_SORT_THRESHOLD(47),如果元素少于47这个阀值,就用插入排序,往下看确实如此:


  
    
    
  
  • /*

  • * Traditional (without sentinel) insertion sort,

  • * optimized for server VM, is used in case of

  • * the leftmost part.

  • */

  • for (int i = left, j = i; i < right; j = ++i) {

  • int ai = a[i + 1];

  • while (ai < a[j]) {

  • a[j + 1] = a[j];

  • if (j-- == left) {

  • break;

  • }

  • }

  • a[j + 1] = ai;

你真的懂快速排序吗?

至于大过INSERTION_SORT_THRESHOLD(47)的,用一种快速排序的方法:
1.从数列中挑出五个元素,称为 “基准”(pivot);
2.重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;
3.递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
你真的懂快速排序吗?

这是少于阀值QUICKSORT_THRESHOLD(286)的两种情况,至于大于286的,它会进入归并排序(Merge Sort),但在此之前,它有个小动作:


  
    
    
  
  • // Check if the array is nearly sorted

  • for (int k = left; k < right; run[count] = k) {

  • if (a[k] < a[k + 1]) { // ascending

  • while (++k <= right && a[k - 1] <= a[k]);

  • } else if (a[k] > a[k + 1]) { // descending

  • while (++k <= right && a[k - 1] >= a[k]);

  • for (int lo = run[count] - 1, hi = k; ++lo < --hi; ) {

  • int t = a[lo]; a[lo] = a[hi]; a[hi] = t;

  • }

  • } else { // equal

  • for (int m = MAX_RUN_LENGTH; ++k <= right && a[k - 1] == a[k]; ) {

  • if (--m == 0) {

  • sort(a, left, right, true);

  • return;

  • }

  • }

  • }


  • /*

  • * The array is not highly structured,

  • * use Quicksort instead of merge sort.

  • */

  • if (++count == MAX_RUN_COUNT) {

  • sort(a, left, right, true);

  • return;

  • }

  • }

这里主要作用是看他数组具不具备结构:实际逻辑是分组排序,每降序为一个组,像1,9,8,7,6,8。9到6是降序,为一个组,然后把降序的一组排成升序:1,6,7,8,9,8。然后最后的8后面继续往后面找。。。

每遇到这样一个降序组,++count,当count大于MAX_RUN_COUNT(67),被判断为这个数组不具备结构(也就是这数据时而升时而降),然后送给之前的sort(里面的快速排序)的方法(The array is not highly structured,use Quicksort instead of merge sort.)。

如果count少于MAX_RUN_COUNT(67)的,说明这个数组还有点结构,就继续往下走下面的归并排序:


  
    
    
  
  • // Determine alternation base for merge

  • byte odd = 0;

  • for (int n = 1; (n <<= 1) < count; odd ^= 1);

从这里开始,正式进入归并排序(Merge Sort)!


  
    
    
  
  • // Merging

  • for (int last; count > 1; count = last) {

  • for (int k = (last = 0) + 2; k <= count; k += 2) {

  • int hi = run[k], mi = run[k - 1];

  • for (int i = run[k - 2], p = i, q = mi; i < hi; ++i) {

  • if (q >= hi || p < mi && a[p + ao] <= a[q + ao]) {

  • b[i + bo] = a[p++ + ao];

  • } else {

  • b[i + bo] = a[q++ + ao];

  • }

  • }

  • run[++last] = hi;

  • }

  • if ((count & 1) != 0) {

  • for (int i = right, lo = run[count - 1]; --i >= lo;

  • b[i + bo] = a[i + ao]

  • );

  • run[++last] = right;

  • }

  • int[] t = a; a = b; b = t;

  • int o = ao; ao = bo; bo = o;

  • }

在文章的结尾,我想分享下下我关于学习算法的一点感悟和认识:学习算法要运用生长学习法,生长学习法是还原事物从无到有的过程把每一个决策点背后的why讲出来。