java 如何实现 binary search 二分查找法?
顺序查找
如果让你在一堆书架上找到自己想要的书,你会怎么找呢?
实际上最简单最粗暴的方式就是一本一本的看过去。
这个用计算机实现就对应着顺序查找。
概念
顺序查找适合于存储结构为顺序存储或链接存储的线性表。
基本思想:顺序查找也称为线形查找,属于无序查找算法。从数据结构线形表的一端开始,顺序扫描,依次将扫描到的结点关键字与给定值k相比较,若相等则表示查找成功;若扫描结束仍没有找到关键字等于k的结点,表示查找失败。
复杂度分析:
查找成功时的平均查找长度为:(假设每个数据元素的概率相等) ASL = 1/n(1+2+3+…+n) = (n+1)/2 ;
当查找不成功时,需要n+1次比较,时间复杂度为O(n);
所以,顺序查找的时间复杂度为O(n)。
代码实现
以 java 代码为例:
/*
** 顺序查询算法
** @param arr 数组信息
** @param target 目标值
** @param arrLength 数组长度
*/
int foreachSearch(int arr[], int target, int arrLength) {
int i;
for(i = 0; i < arrLength; i++) {
if(target == arr[i]) {
return i;
}
}
return -1;
}
java 改进实现
我们这个实现版本主要是为了弥补大部分网上实现的不足,很多实现就是一个 int 类型,适用范围不够广泛。
接口定义
为了后续的拓展性,我们定义查询接口及抽象实现。
package com.github.houbb.search.api;
import java.util.List;
/**
* @author 老马啸西风
* @since 0.0.1
*/
public interface ISearch<T> {
/**
* 执行元素的查询
* @param list 列表
* @param key 目标对象
* @return 结果对应的下标
* @since 0.0.1
*/
int search(List<? extends Comparable<? super T>> list, T key);
}
抽象实现:
package com.github.houbb.search.core;
import com.github.houbb.heaven.util.common.ArgUtil;
import com.github.houbb.heaven.util.util.CollectionUtil;
import com.github.houbb.search.api.ISearch;
import com.github.houbb.search.constant.SearchConst;
import java.util.List;
/**
* 抽象查询类
* @author 老马啸西风
* @since 0.0.1
*/
public abstract class AbstractSearch<T> implements ISearch<T> {
@Override
public int search(List<? extends Comparable<? super T>> list, T key) {
ArgUtil.notNull(key, "key");
if(CollectionUtil.isEmpty(list)) {
return SearchConst.NOT_FOUND;
}
return this.doSearch(list, key);
}
/**
* 执行查询
* @param list 列表
* @param key key
* @return 结果
* @since 0.0.1
*/
protected abstract int doSearch(List<? extends Comparable<? super T>> list, T key);
}
遍历实现
实现和前面基础版本类似。
package com.github.houbb.search.core;
import com.github.houbb.search.constant.SearchConst;
import java.util.List;
/**
* 遍历查询法
* @author 老马啸西风
* @since 0.0.1
*/
public class ForeachSearch<T> extends AbstractSearch<T> {
@Override
@SuppressWarnings("all")
protected int doSearch(List<? extends Comparable<? super T>> list, T key) {
for(int i = 0; i < list.size(); i++) {
Comparable comparable = list.get(i);
if(comparable.compareTo(key) == 0) {
return i;
}
}
return SearchConst.NOT_FOUND;
}
}
这个实现的适用范围故意被我们缩小为可比较类型了,实际上可以更加广泛一些,理论上只要能通过 equals() 比较的对象都可以。
其实主要是为了兼容我们下面要讲的二分查找法,也是我们本文的重点。
二分查找法
遍历查询非常的简单粗暴,不过性能也是比较差的。
如果要查找的数据已经排序过了,比如我们通过查看联系人时,一般可以通过姓名快速找到大概的位置,而不是从头到尾的看一遍。
这个通过计算机实现就是二分查找法。
概念
二分搜索(英语:binary search),也称折半搜索(英语:half-interval search)、对数搜索(英语:logarithmic search),是一种在有序数组中查找某一特定元素的搜索算法。
搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束;
如果某一特定元素大于或者小于中间元素,则在数组大于或小于中间元素的那一半中查找,而且跟开始一样从中间元素开始比较。
如果在某一步骤数组为空,则代表找不到。这种搜索算法每一次比较都使搜索范围缩小一半。
复杂度概览
分类 | 搜索算法 |
---|---|
数据结构 | 数组 |
最坏时间复杂度 | O(log(n)) |
最优时间复杂度 | O(1) |
平均时间复杂度 | O(log(n)) |
空间复杂度 | 迭代: O(1); 递归: O(log(n)) |
步骤
(1)首先确定整个查找区间的中间位置 mid = ( left + right )/ 2
(2)用待查关键字值与中间位置的关键字值进行比较;
若相等,则查找成功
若大于,则在后(右)半个区域继续进行折半查找
若小于,则在前(左)半个区域继续进行折半查找
(3)对确定的缩小区域再按折半公式,重复上述步骤。
最后,得到结果:要么查找成功, 要么查找失败。
折半查找的存储结构采用一维数组存放。
注意:这里有一个前提,数组必须是有序的。如果元素无序怎么办呢?当然是先执行排序,然后再通过折半查找了。
排序算法不是本文重点,可以参考:
java 代码实现
我们先来看一下网上最常见的两种实现。
递归实现
public static int binarySearch(int[] arr, int start, int end, int hkey){
if (start > end)
return -1;
int mid = start + (end - start)/2; //防止溢位
if (arr[mid] > hkey)
return binarySearch(arr, start, mid - 1, hkey);
if (arr[mid] < hkey)
return binarySearch(arr, mid + 1, end, hkey);
return mid;
}
递归实现的版本非常的简洁优雅。
循环实现
public static int binarySearch(int[] arr, int start, int end, int hkey){
int result = -1;
while (start <= end){
int mid = start + (end - start)/2; //防止溢位
if (arr[mid] > hkey)
end = mid - 1;
else if (arr[mid] < hkey)
start = mid + 1;
else {
result = mid ;
break;
}
}
return result;
}
循环实现相对麻烦一些,不过性能一般会比递归好一点。
java 改良版本
上面的方法非常简洁,问题也同样明显。
如果我想比较查找 String、Long 等其他常见类型怎么办呢?
我们可以稍微改良一下上面的实现:
package com.github.houbb.search.core;
import com.github.houbb.search.constant.SearchConst;
import java.util.List;
/**
* 折半
* @author 老马啸西风
* @since 0.0.1
*/
public class BinarySearch<T> extends AbstractSearch<T> {
@Override
@SuppressWarnings("all")
protected int doSearch(List<? extends Comparable<? super T>> list, T key) {
int low = 0;
int high = list.size()-1;
while (low <= high) {
int mid = (low+high) / 2;
Comparable comparable = list.get(mid);
if(comparable.compareTo(key) == 0) {
return mid;
} else if(comparable.compareTo(key) < 0) {
// 小于指定元素
low = mid;
} else {
// 大于指定元素
high = mid;
}
}
return SearchConst.NOT_FOUND;
}
}
这里我们将比较对象扩展为 Comparable 对象,然后通过 compareTo 方法进行比较。
开源工具
当然一般的查找算法到这里就结束了,但是老马却不这么认为。
知其然,知其所以然,所以我们要学习算法原理。
君子性非异也, 善假于物也,所以我们要学会使用工具。
算法应该被封装为简单可用的工具,便于使用。于是老马把上面的两种查询算法开源到了 maven 中央仓库,便于后期使用可拓展。
maven 引入
<dependency>
<groupId>com.github.houbb</groupId>
<artifactId>search</artifactId>
<version>0.0.1</version>
</dependency>
使用
遍历查询
final List<String> list = Arrays.asList("1", "2", "3", "4", "5");
Assert.assertEquals(3, SearchHelper.foreach(list, "4"));
折半查询
final List<String> list = Arrays.asList("1", "2", "3", "4", "5");
Assert.assertEquals(3, SearchHelper.binary(list, "4"));
小结
希望本文对你有帮助,如果有其他想法的话,也可以评论区和大家分享哦。
各位极客的点赞收藏转发,是老马持续写作的最大动力!