你不知道的“二分查找”
二分查找针对的是一个有序的数据集合,查找思想有点类似分治思想。每次都通过跟区间的中间元素对比,将待查找的区间缩小为之前的一半,直到找到要查找的元素,或者区间被缩小为0。
普通版代码实现:
public static int binarySearch(int[] arr,int num){
int left = 0;
int right = arr.length - 1;
while (left <= right){
//防止两者之后导致类型值溢出
int mid = left + ((right - left) >> 1);
if (arr[mid] == num){
return mid;
}else if (arr[mid] > num){
right = mid - 1;
}else {
left = mid + 1;
}
}
return -1;
}
容易出错的几个地方:
循环的条件,注意是left <= right,而不是left < right
mid的取值,尽量少用mid = (left + right) / 2,当值比较大时,容易导致值溢出,可以使用 mid = left + ((right - left) >> 1)
low和high的更新,一般low = mid + 1,high = mid - 1;
递归实现:
public static int binarySearch1(int[] arr, int value){
return binarySearchInternally(arr,0,arr.length - 1,value);
}
private static int binarySearchInternally(int[] arr,int low,int high,int value){
if (low > high) return -1;
//防止类型值溢出
int mid = low + ((high - low) >> 1);
if (arr[mid] == value){
return mid;
}else if (arr[mid] > value){
return binarySearchInternally(arr,low, mid - 1,value);
}else {
return binarySearchInternally(arr,mid + 1,high,value);
}
}
二分查找局限性:
二分查找依赖的是顺序表结构,即数组
二分查找需要是有序数据
数据量太小或太大,都不适合用二分查找。太小,普通查找效率不一定比二分查找低,太大,很难找到连续的内存空间。
二分查找的多种情况
1. 查找第一个给定值的元素
即上述两种方法,即可解决
2. 查找最后一个值等于给定值的元素
public static int binarySearch2(int[] arr,int num){
int left = 0;
int right = arr.length - 1;
while (left <= right){
//防止两者之后导致类型值溢出
int mid = left + ((right - left) >> 1);
if (arr[mid] > num){
right = mid - 1;
}else if (arr[mid] < num){
left = mid + 1;
}else {
if ((mid == arr.length - 1) || (arr[mid + 1] != num)){
return mid;
}else {
left = mid + 1;
}
}
}
return -1;
}
如果arr[mid]这个元素已经是数组中的最后一个元素了,那它肯定是我们要找的;如果arr[mid]的后一个元素arr[mid+1]不等于num,那也说明arr[mid]就是我们要找的最后一个值等于给定值的元素。
3. 查找第一个大于等于给定值的元素
比如,数组中存储的这样一个序列:3,4,6,7,10。如果查找第一个大于等于5的元素,那就是6。
思路:
如果arr[mid]小于要查找的值num,那要查找的值肯定在[mid+1, right]之间,所以,更新left=mid+1。
对于arr[mid]大于等于给定值num的情况,要先看下这个arr[mid]是不是我们要找的第一个值大于等于给定值的元素。如果arr[mid]前面已经没有元素,或者前面一个元素小于要查找的值num,那arr[mid]就是要找的元素。
public static int binarySearch3(int[] arr,int num){
int left = 0;
int right = arr.length - 1;
while (left <= right){
//防止两者之后导致类型值溢出
int mid = left + ((right - left) >> 1);
if (arr[mid] >= num){
if (mid == 0 || arr[mid - 1] < num){
return mid;
}
right = mid - 1;
}else {
left = mid + 1;
}
}
return -1;
}
4. 查找最后一个小于等于给定值的元素
第四种情况和第三个情况相反
当arr[mid] > num时,意味着数据在[left, mid - 1]之间,right = mid - 1即可;
当arr[mid] <= num时,要先看下这个arr[mid]是不是我们要找的最后一个小于等于给定值的元素。如果arr[mid]后面已经没有元素,或者后面一个元素大于要查找的值num,那arr[mid]就是要找的元素。
代码实现:
public static int binarySearch4(int[] arr,int num){
int left = 0;
int right = arr.length - 1;
while (left <= right){
//防止两者之后导致类型值溢出
int mid = left + ((right - left) >> 1);
if (arr[mid] > num){
right = mid - 1;
}else {
if (mid == arr.length - 1 || arr[mid + 1] > num){
return mid;
}
left = mid + 1;
}
}
return -1;
}
二分查找的应用:
1.如何编程实现“求一个数的平方根”?要精确到小数点后6位
public static double sqrt(double x , double precision){
if (x < 0){
return Double.NaN;
}
double low = 0;
double high = x;
if (x < 1 && x > 0){
low = x;
high = 1;
}
double mid = low + (high - low) / 2;
while (high - low > precision){
if (mid * mid > x){
high = mid;
}else if (mid * mid < x){
low = mid;
}else {
return mid;
}
mid = low + (high - low) / 2;
}
return mid;
}
然后问题就是今天提到的二分查找第四种情况。当我们要查询某个IP归属地时,我们可以先通过二分查找,找到最后一个起始IP小于等于这个IP的IP区间,然后,检查这个IP是否在这个IP区间内,如果在,我们就取出对应的归属地显示;如果不在,就返回未查找到。