二分查找(Binary Search)算法,也叫折半查找算法。二分查找针对的是一个有序的数据集合,查找思想有点类似分治思想。每次都通过跟区间的中间元素对比,将待查找的区间缩小为之前的一半,直到找到要查找的元素,或者区间被缩小为 0。
二分查找的递归与非递归实现
function baearch(a, n, value) {let low = 0;let high = n - 1;while(low <= high) {let mid = low + ((high - low) >> 1);if (a[mid] === value) {return mid;} else if (a[mid] < value) {low = mid + 1;} else {high = mid - 1;}}return -1;}
容易出错的 3 个地方。
1. 循环退出条件
注意是 low<=high,而不是 low<high。
2.mid 的取值。
实际上,mid=(low+high)/2 这种写法是有问题的。因为如果 low 和 high 比较大的话,两者之和就有可能会溢出。改进的方法是将 mid 的计算方式写成 low+(high-low)/2。更进一步,如果要将性能优化到极致的话,我们可以将这里的除以 2 操作转化成位运算 low+((high-low)>>1)。因为相比除法运算来说,计算机处理位运算要快得多。
3.low 和 high 的更新
low=mid+1,high=mid-1。注意这里的 +1 和 -1,如果直接写成 low=mid 或者 high=mid,就可能会发生死循环。比如,当 high=3,low=3 时,如果 a[3]不等于 value,就会导致一直循环不退出
function bsearch(a, n, value) {return bsearchInternally(a, 0, n -1, value);}function bsearchInternally(a, low, high, value) {if (low > high) return -1;let mid = low + ((high - low) >> 1);if (a[mid] === value) {return mid;} else if (a[mid] < value) {return bsearchInternally(a, mid + 1, high, value);} else {return bsearchInternally(a, low, mid - 1, value);}}
查找第一个值等于给定值的元素
function bsearch(a, n, value) {let low = 0;let high = n - 1;while(low <= high) {let mid = low + ((high - low) >> 1);if (a[mid] > value) {hight = mid - 1;} else if (a[mid] < value) {low = mid + 1;} else {if ((mid === 0) || (a[mid - 1] !== value)) {return mid;} else {high = mid - 1;}}}return -1;}
二分查找应用场景的局限性
首先,二分查找依赖的是顺序表结构,简单点说就是数组。二分查找算法需要按照下标随机访问元素。
其次,二分查找针对的是有序数据。
二分查找对这一点的要求比较苛刻,数据必须是有序的。如果数据没有序,我们需要先排序。
再次,数据量太小不适合二分查找。
如果要处理的数据量很小,完全没有必要用二分查找,顺序遍历就足够了。比如我们在一个大小为 10 的数组中查找一个元素,不管用二分查找还是顺序遍历,查找速度都差不多。只有数据量比较大的时候,二分查找的优势才会比较明显。
不过,这里有一个例外。如果数据之间的比较操作非常耗时,不管数据量大小,都推荐使用二分查找。比如,数组中存储的都是长度超过 300 的字符串,如此长的两个字符串之间比对大小,就会非常耗时。我们需要尽可能地减少比较次数,而比较次数的减少会大大提高性能,这个时候二分查找就比顺序遍历更有优势。
最后,数据量太大也不适合二分查找。
二分查找的底层需要依赖数组这种数据结构,而数组为了支持随机访问的特性,要求内存空间连续,对内存的要求比较苛刻。比如,我们有 1GB 大小的数据,如果希望用数组来存储,那就需要 1GB 的连续内存空间。
