vlambda博客
学习文章列表

二分查找又叫折半查找,是一种简单又快速的查找算法

1. 作用和要求

当我们要从一个序列中查找一个元素的时候,二分查找是一种非常快速的查找算法,二分查找又叫折半查找。它对要查找的序列有两个要求,一是该序列必须是有序的(即该序列中的所有元素都是按照大小关系排好序的,升序和降序都可以,本文假设是升序排列的),二是该序列必须是顺序存储的。图1展示的就是一个能进行二分查找的序列。

图1 有序且顺序存储的序列

如果一个序列是无序的或者是链表,那么该序列就不能进行二分查找。之所以被查找的序列要满足这样的条件,是由二分查找算法的原理决定的。

2. 算法原理

二分查找算法的原理如下:

1. 如果待查序列为空,那么就返回-1,并退出算法;这表示查找不到目标元素。

2. 如果待查序列不为空,则将它的中间元素与要查找的目标元素进行匹配,看它们是否相等。

3. 如果相等,则返回该中间元素的索引,并退出算法;此时就查找成功了。

4. 如果不相等,就再比较这两个元素的大小。

5. 如果该中间元素大于目标元素,那么就将当前序列的前半部分作为新的待查序列;这是因为后半部分的所有元素都大于目标元素,它们全都被排除了。

6. 如果该中间元素小于目标元素,那么就将当前序列的后半部分作为新的待查序列;这是因为前半部分的所有元素都小于目标元素,它们全都被排除了。

7. 在新的待查序列上重新开始第1步的工作。

二分查找之所以快速,是因为它在匹配不成功的时候,每次都能排除剩余元素中一半的元素。因此可能包含目标元素的有效范围就收缩得很快,而不像顺序查找那样,每次仅能排除一个元素。

3. 示例

我们用两个示例来演示二分查找的过程,一看就能明白。第一个示例演示查找成功的情况,第二个示例演示查找不到目标元素的情况。

演示过程中用到的变量如下:low指向待查序列中的第一个元素,high指向待查序列中的最后一个元素,mid指向待查序列的中间元素,target代表要查找的目标元素。

3.1 查找成功的情况

假设原始序列为array=[3, 12, 24, 31, 46, 48, 52, 66, 69, 79, 82],目标元素target=52。

1. 开始时,low=0,high=10,mid=(low + high) / 2 = 5。

二分查找又叫折半查找,是一种简单又快速的查找算法

比较中间元素和目标元素,48小于52。这说明若目标元素存在,则它必定在原序列的后半部分。让low=mid + 1 = 6而high不变,这样low和high就指向了原序列的后半部分。

2. 此时,low=6,high=10,mid=(low + high) / 2 = 8。

二分查找又叫折半查找,是一种简单又快速的查找算法

同样的,比较新的中间元素和目标元素,69大于52。这说明若目标元素存在,它必定在当前待查序列的前半部分。让high=mid - 1 = 7而low不变,这样low和high就指向当前待查序列的前半部分。

3. 此时,low=6,high=7,mid=(low + high) / 2 = 6。

二分查找又叫折半查找,是一种简单又快速的查找算法

比较新的中间元素和目标元素,52等于52。查找成功,返回该中间元素的索引6并退出算法。

3.2 查找不到的情况

假设原始序列为array=[5, 10, 22, 29, 43, 57, 58, 61, 73, 77, 81],目标元素target=70。

1. 开始时,low=0,high=10,mid=(low + high) / 2 = 5;

二分查找又叫折半查找,是一种简单又快速的查找算法

比较中间元素和目标元素,57小于70。这说明若目标元素存在,那么它一定在原序列的后半部分。让low=mid + 1 = 6而high不变,这样low和high就指向原序列的后半部分。

2. 此时,low=6,high=10,mid=(low + high) / 2 = 8;

二分查找又叫折半查找,是一种简单又快速的查找算法

比较新的中间元素和目标元素,73大于70。这说明若目标元素存在,那么它一定在当前待查序列的前半部分。让high=mid - 1 = 7而low不变,这样low和high就指向当前待查序列的前半部分。

3. 此时,low=6,high=7,mid=(low + high) / 2 = 6;

二分查找又叫折半查找,是一种简单又快速的查找算法

比较新的中间元素和目标元素,58小于70。这说明若目标元素存在,那么它一定在当前待查序列的后半部分。让low=mid + 1 = 7而high不变,这样low和high就指向当前待查序列的后半部分。

4. 此时,low=7,high=7,mid=(low + high) / 2 = 7;

二分查找又叫折半查找,是一种简单又快速的查找算法

比较新的中间元素和目标元素,61小于70。这说明若目标元素存在,那么它一定在当前待查序列的后半部分。让low=mid + 1 = 8而high不变。

5. 此时,low=8,high=7,low大于high说明待查序列已为空,也就说明查找不到目标元素。此时,返回-1并退出算法,表示查找不成功。

二分查找又叫折半查找,是一种简单又快速的查找算法

4. 算法实现

我们给出二分查找的一个简单的实现,其它情况可以依此类推。在该简单实现中,我们使用C语言并且假设序列中的元素是整数。

/* * Function: binarySearch * Description: 二分查找的实现,如果查找成功则返回目标元素在序列中的索引; 如果查找不成功则返回-1. * Param: array 待查序列 * Param: n 序列中的元素个数 * Param: target 要查找的目标元素 * Return: 目标元素在序列中的索引或-1 */int binarySearch(int array[], int n, int target) { /* * 定义并初始化low和high,声明mid */ int low = 0; int high = n - 1; int mid;
/* * 如果low小于或等于high,则说明待查序列不为空; * 需要将其中间元素和目标元素进行匹配。 */ while (low <= high) { /* 计算中间元素的索引 */ mid = (low + high) / 2;
if (array[mid] == target) { /* 查找成功,返回该中间元素的索引 */ return mid; } else if (array[mid] > target) { high = mid - 1; } else { /* array[mid] < target */ low = mid + 1; } }
/* 没有匹配的元素 */ return -1;}

5. 二分查找的性能分析

5.1 时间复杂度

在最好的情况下只需要进行1次比较就能找到目标元素,那么最坏的情况呢?此时,可以借助该序列的二叉树形式进行分析。将一个序列转换为二叉树的过程是这样的:将它的中间元素作为它的根节点,将中间元素之前的前半部分作为它的左子树,将中间元素之后的后半部分作为它的右子树;在创建左子树和右子树的时候递归利用这一规则。

比如第3.2小节的序列[5, 10, 22, 29, 43, 57, 58, 61, 73, 77, 81]可以构建成如图2所示的二叉树。

图2 序列的二叉树形式

5.2 空间复杂度

(完)