第 8 章 查找算法

1、查找算法介绍

  • 顺序(线性)查找
  • 二分查找/折半查找
  • 插值查找
  • 斐波那契查找

2、线性查找

  • 编写线性查找算法代码 ```java public class SeqSearch {

    public static void main(String[] args) {

    1. int[] arr = { 1, 2, 3, 4, 5 };// 没有顺序的数组
    2. int index = seqSearch(arr, -11);
    3. if (index == -1) {
    4. System.out.println("没有找到到");
    5. } else {
    6. System.out.println("找到,下标为=" + index);
    7. }

    }

    /**

    • 这里我们实现的线性查找是找到一个满足条件的值,就返回
    • @param arr
    • @param value
    • @return */ public static int seqSearch(int[] arr, int value) { // 线性查找是逐一比对,发现有相同值,就返回下标 for (int i = 0; i < arr.length; i++) {
      1. if (arr[i] == value) {
      2. return i;
      3. }
      } return -1; }

}

  1. - 程序运行结果
  2. ```java
  3. 找到,下标为=4

3.二分查找

3.1、二分查找思路

  • 二分查找算法的前提:数组必须是有序数组
  • 二分查找算法思路分析(递归版):

定义两个辅助指针:left、right ,待查找的元素在 arr[left]~arr[right] 之间
left 初始值为 0 ,right 初始值为 arr.length - 1
将数组分成两半:int mid = (left + right) / 2; ,取数组中间值与目标值 findVal 比较>
如果 mid > findVal ,说明待查找的值在数组左半部分
如果 mid < findVal ,说明待查找的值在数组右半部分
如果 mid == findVal ,查找到目标值,返回即可
何时终止递归?分为两种情况:
找到目标值,直接返回目标值 findVal ,结束递归即可
未找到目标值:left > right,这样想:如果递归至数组中只有一个数时(left == right),还没有找到目标值,继续执行下一次递归时, left 指针和 right 指针总有一个会再走一步,这时 left 和 right 便会错开,此时 left > right ,返回 -1 并结束递归表示没有找到目标值
image.png

3.2、代码实现

3.2.1、二分查找(单个值)

  • 编写二分查找算法:查找到目标值就返回 ```java //注意:使用二分查找的前提是 该数组是有序的. public class BinarySearch {

    public static void main(String[] args) {

    1. int arr[] = { 1, 8, 10, 89, 1000, 1234 };
    2. int resIndex = binarySearch(arr, 0, arr.length - 1, 1000);
    3. System.out.println("resIndex=" + resIndex);

    }

    // 二分查找算法 /**

    • @param arr 数组
    • @param left 左边的索引
    • @param right 右边的索引
    • @param findVal 要查找的值
    • @return 如果找到就返回下标,如果没有找到,就返回 -1 */ public static int binarySearch(int[] arr, int left, int right, int findVal) {

      // 当 left > right 时,说明递归整个数组,但是没有找到 if (left > right) {

      1. return -1;

      } int mid = (left + right) / 2; int midVal = arr[mid];

      if (findVal > midVal) { // 向 右递归

      1. return binarySearch(arr, mid + 1, right, findVal);

      } else if (findVal < midVal) { // 向左递归

      1. return binarySearch(arr, left, mid - 1, findVal);

      } else {

      1. return mid;

      }

      }

} //注意:使用二分查找的前提是 该数组是有序的. public class BinarySearch {

  1. public static void main(String[] args) {
  2. int arr[] = { 1, 8, 10, 89, 1000, 1234 };
  3. int resIndex = binarySearch(arr, 0, arr.length - 1, 1000);
  4. System.out.println("resIndex=" + resIndex);
  5. }
  6. // 二分查找算法
  7. /**
  8. *
  9. * @param arr 数组
  10. * @param left 左边的索引
  11. * @param right 右边的索引
  12. * @param findVal 要查找的值
  13. * @return 如果找到就返回下标,如果没有找到,就返回 -1
  14. */
  15. public static int binarySearch(int[] arr, int left, int right, int findVal) {
  16. // 当 left > right 时,说明递归整个数组,但是没有找到
  17. if (left > right) {
  18. return -1;
  19. }
  20. int mid = (left + right) / 2;
  21. int midVal = arr[mid];
  22. if (findVal > midVal) { // 向 右递归
  23. return binarySearch(arr, mid + 1, right, findVal);
  24. } else if (findVal < midVal) { // 向左递归
  25. return binarySearch(arr, left, mid - 1, findVal);
  26. } else {
  27. return mid;
  28. }
  29. }

}

  1. - 程序运行结果
  2. ```java
  3. resIndex=4

3.2.2、二分查找(所有值)

  • 编写二分查找算法:查找到所有目标值,在找到目标值之后,分别往左、往右进行扩散搜索 ```java //注意:使用二分查找的前提是 该数组是有序的. public class BinarySearch {

    public static void main(String[] args) {

    1. int arr[] = { 1, 8, 10, 89, 1000, 1000, 1000, 1234 };
    2. List<Integer> resIndexList = binarySearch(arr, 0, arr.length - 1, 1000);
    3. System.out.println("resIndexList=" + resIndexList);

    }

  1. // 完成一个课后思考题:
  2. /*
  3. * 课后思考题: {1,8, 10, 89, 1000, 1000,1234} 当一个有序数组中, 有多个相同的数值时,如何将所有的数值都查找到,比如这里的
  4. * 1000
  5. *
  6. * 思路分析 1. 在找到mid 索引值,不要马上返回 2. 向mid 索引值的左边扫描,将所有满足 1000, 的元素的下标,加入到集合ArrayList
  7. * 3. 向mid 索引值的右边扫描,将所有满足 1000, 的元素的下标,加入到集合ArrayList 4. 将Arraylist返回
  8. */
  9. public static List<Integer> binarySearch(int[] arr, int left, int right, int findVal) {
  10. // 当 left > right 时,说明递归整个数组,但是没有找到
  11. if (left > right) {
  12. return new ArrayList<Integer>();
  13. }
  14. int mid = (left + right) / 2;
  15. int midVal = arr[mid];
  16. if (findVal > midVal) { // 向 右递归
  17. return binarySearch(arr, mid + 1, right, findVal);
  18. } else if (findVal < midVal) { // 向左递归
  19. return binarySearch(arr, left, mid - 1, findVal);
  20. } else {
  21. // 思路分析
  22. // 1. 在找到mid 索引值,不要马上返回
  23. // 2. 向mid 索引值的左边扫描,将所有满足 1000, 的元素的下标,加入到集合ArrayList
  24. // 3. 向mid 索引值的右边扫描,将所有满足 1000, 的元素的下标,加入到集合ArrayList
  25. // 4. 将Arraylist返回
  26. List<Integer> resIndexlist = new ArrayList<Integer>();
  27. // 向mid 索引值的左边扫描,将所有满足 1000, 的元素的下标,加入到集合ArrayList
  28. int temp = mid - 1;
  29. while (true) {
  30. if (temp < 0 || arr[temp] != findVal) {// 退出
  31. break;
  32. }
  33. // 否则,就temp 放入到 resIndexlist
  34. resIndexlist.add(temp);
  35. temp -= 1; // temp左移
  36. }
  37. resIndexlist.add(mid); //
  38. // 向mid 索引值的右边扫描,将所有满足 1000, 的元素的下标,加入到集合ArrayList
  39. temp = mid + 1;
  40. while (true) {
  41. if (temp > arr.length - 1 || arr[temp] != findVal) {// 退出
  42. break;
  43. }
  44. // 否则,就temp 放入到 resIndexlist
  45. resIndexlist.add(temp);
  46. temp += 1; // temp右移
  47. }
  48. return resIndexlist;
  49. }
  50. }

}

  1. - 程序运行结果
  2. ```java
  3. resIndexList=[4, 5, 6]

4、插值查找

4.1、插值查找基本介绍

  • 插值查找算法类似于二分查找, 不同的是插值查找每次从自适应 mid 处开始查找。

    4.2、插值查找图解

    将折半查找中的求 mid 索引的公式 , low 表示左边索引 left ,high 表示右边索引 right ,key 就是前面我们讲的 findVal
    图中公式:int mid = low + (high - low) (key - arr[low]) / (arr[high] - arr[low]) ;
    对应前面的代码公式:
    int mid = left + (right – left)
    (findVal – arr[left]) / (arr[right] – arr[left])
    image.png
    大致思路和二分查找一样,有如下不同:
    寻找 mid 公式不同:

int mid = left + (right – left) * (findVal – arr[left]) / (arr[right] – arr[left]);

由于公式中出现 findVal ,所以 findVal 的值不能过大或者过小,否则会引起 mid 过大或过小,引起数组越界问题,

添加判断:findVal < arr[left] 和 findVal > arr[right]
why?findVal = arr[left] 时,mid = left;findVal = arr[right] 时,mid = right;
image.png

4.3、代码实现

  • 编写插值查找算法 ```java public class InsertValueSearch {

    public static void main(String[] args) {

    1. int [] arr = new int[100];
    2. for(int i = 0; i < 100; i++) {
    3. arr[i] = i + 1;
    4. }
    5. int index = insertValueSearch(arr, 0, arr.length - 1, 1);
    6. System.out.println("index = " + index);

    }

    //编写插值查找算法 //说明:插值查找算法,也要求数组是有序的 /**

    • @param arr 数组
    • @param left 左边索引
    • @param right 右边索引
    • @param findVal 查找值
    • @return 如果找到,就返回对应的下标,如果没有找到,返回-1 */ public static int insertValueSearch(int[] arr, int left, int right, int findVal) {

      System.out.println(“插值查找次数~~”);

      //注意:findVal < arr[left] 和 findVal > arr[right] 必须需要,否则我们得到的 mid 可能越界 // findVal < arr[left] :说明待查找的值比数组中最小的元素都小 // findVal > arr[right] :说明待查找的值比数组中最大的元素都大 if (left > right || findVal < arr[left] || findVal > arr[right]) {

      1. return -1;

      }

      // 求出mid, 自适应,额,这不就是一次函数吗 // findVal = arr[left] 时,mid = left // findVal = arr[right] 时,mid = right int mid = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]); int midVal = arr[mid]; if (findVal > midVal) { // 说明应该向右边递归

      1. return insertValueSearch(arr, mid + 1, right, findVal);

      } else if (findVal < midVal) { // 说明向左递归查找

      1. return insertValueSearch(arr, left, mid - 1, findVal);

      } else {

      1. return mid;

      }

      } }

  1. - 程序运行结果
  2. ```java
  3. 插值查找次数~~
  4. index = 0

4.4、总结

  • 对于数据量较大,关键字分布比较均匀(最好是线性分布)的查找表来说,采用插值查找,速度较快
  • 关键字分布不均匀的情况下, 该方法不一定比折半查找要好

斐波那契 查找

5.1、斐波那契数列

黄金分割点是指把一条线段分割为两部分, 使其中一部分与全长之比等于另一部分与这部分之比。 取其前三位数字的近似值是 0.618。 由于按此比例设计的造型十分美丽, 因此称为黄金分割, 也称为中外比。 这是一个神奇的数字, 会带来意想不到的效果。
斐波那契数列 { 1, 1, 2, 3, 5, 8, 13, 21, 34, 55 } 发现斐波那契数列的两个相邻数的比例, 无限接近 黄金分割值 0.618

5.2、斐波那契查找介绍

那为什么一定要等分呐?能不能进行“黄金分割”?也就是 mid = left+0.618(right-left) ,当然mid 要取整数。如果这样查找,时间复杂性是多少?也许你还可以编程做个试验,比较一下二分法和“黄金分割”法的执行效率。

斐波那契查找算法又称为黄金分割法查找算法,斐波那契查找原理与前两种相似, 仅仅改变了中间结点(mid) 的位置,mid 不再是中间或由插值计算得到,而是位于黄金分割点附近, 即 mid = low + F(k-1) - 1

对 F(k)-1 的理解

  • 由斐波那契数列 F[k]=F[k-1]+F[k-2] 的性质, 可以得到 ```java F[k]-1) =(F[k-1]-1) +(F[k-2]-1) + 1
  1. 该式说明:只要顺序表的长度为 F[k]-1 则可以将该表分成长度为 F[k-1]-1 F[k-2]-1 的两段 ,即如图所示。 从而中间位置为 mid=low+F(k-1)-1 ,类似的, 每一子段也可以用相同的方式分割<br />但顺序表长度 n 不一定刚好等于 F[k]-1 所以需要将原来的顺序表长度 n 增加至 F[k]-1 这里的 k 值只要能使得 F[k]-1 恰好大于或等于 n 即可<br />为什么数组总长度是 F(k) - 1 ,而不是 F(k) ?因为凑成 F(k-1) 才能找出中间值,如果数组长度为 F(k) ,而 F(k) = F(k-1) + F(k-2) ,咋个找中间值嘞?<br />为什么数组左边的长度是 F(k-1) - 1 ,数组右边的长度是 F(k-2) - 1 ?就拿个斐波那契数列来说:{ 1, 1, 2, 3, 5, 8, 13, 21, 34, 55 } 54 = 33 + 20 + 1 ,左边是不是 F(k-1) - 1 ,右边是不是 F(k-2) - 1 ,也恰好空出了一个中间值~~~
  2. ![image.png](https://cdn.nlark.com/yuque/0/2022/png/2673847/1642473976016-2e9bcdfc-38f9-4e93-8eb4-3f92665d912f.png#clientId=u2a1fad2a-5836-4&crop=0&crop=0&crop=1&crop=1&errorMessage=unknown%20error&from=paste&height=200&id=u7c5273db&margin=%5Bobject%20Object%5D&name=image.png&originHeight=200&originWidth=634&originalType=binary&ratio=1&rotation=0&showTitle=false&size=39907&status=error&style=none&taskId=u45af7f9f-f2eb-4c98-8841-958b8653540&title=&width=634)
  3. <a name="Q7BIS"></a>
  4. ### 5.3、斐波那契查找思路
  5. 先根据原数组大小,计算斐波那契数列的得 k 值<br />数组扩容条件是:增大 k 值(索引从 0 开始),使得数组长度刚好大于或者等于斐波那契数列中的 F[k]-1 ,我们定义临时数组 temp temp 后面为 0 的元素都按照数组最大元素值填充<br />何时终止斐波那契查找?<br /> 找到目标值:直接返回目标值索引<br /> 没有找到目标值:low 指针和 high 指针相等或者擦肩而过,即 low >= high<br />为什么 low == high 时需要单独拎出来?<br />low == high 时说明此时数组中只剩下一个元素(a[low] 或者 a[high])没有与目标值比较,并且此时 k 有可能等于 0 ,无法执行 mid = low + f[k - 1] - 1; 操作(k - 1 将导致数组越界)<br />解决办法:我们在程序的最后,将 a[low] 或者 a[high] 单独与目标值 value 进行比较即可,我是通过 Debug 解决数组越界异常的,我并没有想明白,但是不把 low == high 单独拎出来,就会抛异常,哎,烧脑壳~~~改天再想<br />mid 值怎么定?mid = low + f[k - 1] - 1 :用黄金分割点确定 mid 的值<br />左右两条路,你怎么选?<br />key < temp[mid] :目标值在黄金分割点的左边,看上面的图,应该是 k -= 1;<br />key > temp[mid] :目标值在黄金分割点的右边,看上面的图,应该是 k -= 2;<br />key = temp[mid] :找到目标值,因为数组经历过扩容,后面的值其实有些是多余的,mid 可能会越界(相对于原数组来说)<br />mid <= high :证明 mid 索引在原数组中,返回 mid<br />mid > high 时,证明 mid 索引已经越界(相对于原数组来说),返回 high
  6. <a name="BGCjx"></a>
  7. ### 5.4、代码实现
  8. - 编写斐波那契查找算法
  9. ```java
  10. public class FibonacciSearch {
  11. public static int maxSize = 20;
  12. public static void main(String[] args) {
  13. int[] arr = { 1, 2, 3, 4, 5 };
  14. System.out.println("index=" + fibSearch(arr, 5));
  15. }
  16. // 因为后面我们mid=low+F(k-1)-1,需要使用到斐波那契数列,因此我们需要先获取到一个斐波那契数列
  17. // 非递归方法得到一个斐波那契数列
  18. public static int[] fib() {
  19. int[] f = new int[maxSize];
  20. f[0] = 1;
  21. f[1] = 1;
  22. for (int i = 2; i < maxSize; i++) {
  23. f[i] = f[i - 1] + f[i - 2];
  24. }
  25. return f;
  26. }
  27. // 编写斐波那契查找算法
  28. // 使用非递归的方式编写算法
  29. /**
  30. *
  31. * @param a 数组
  32. * @param key 我们需要查找的关键码(值)
  33. * @return 返回对应的下标,如果没有-1
  34. */
  35. public static int fibSearch(int[] a, int key) {
  36. int low = 0;
  37. int high = a.length - 1;
  38. int k = 0; // 表示斐波那契分割数值的下标
  39. int mid = 0; // 存放mid值
  40. int f[] = fib(); // 获取到斐波那契数列
  41. // 获取到斐波那契分割数值的下标
  42. while (high > f[k] - 1) {
  43. k++;
  44. }
  45. // 因为 f[k] 值 可能大于 a 的 长度,因此我们需要使用Arrays类,构造一个新的数组,并指向temp[]
  46. // 不足的部分会使用0填充
  47. int[] temp = Arrays.copyOf(a, f[k]);
  48. // 实际上需求使用a数组最后的数填充 temp
  49. // 举例:
  50. // temp = {1,8, 10, 89, 1000, 1234, 0, 0} => {1,8, 10, 89, 1000, 1234, 1234,
  51. // 1234,}
  52. for (int i = high + 1; i < temp.length; i++) {
  53. temp[i] = a[high];
  54. }
  55. // 使用while来循环处理,找到我们的数 key
  56. while (low < high) { // 只要这个条件满足,就可以找
  57. mid = low + f[k - 1] - 1;
  58. if (key < temp[mid]) { // 我们应该继续向数组的前面查找(左边)
  59. high = mid - 1;
  60. // 为甚是 k--
  61. // 说明
  62. // 1. 全部元素 = 前面的元素 + 后边元素
  63. // 2. f[k] = f[k-1] + f[k-2]
  64. // 因为 前面有 f[k-1]个元素,所以可以继续拆分 f[k-1] = f[k-2] + f[k-3]
  65. // 即 在 f[k-1] 的前面继续查找 k--
  66. // 即下次循环 mid = f[k-1-1]-1
  67. k--;
  68. } else if (key > temp[mid]) { // 我们应该继续向数组的后面查找(右边)
  69. low = mid + 1;
  70. // 为什么是k -=2
  71. // 说明
  72. // 1. 全部元素 = 前面的元素 + 后边元素
  73. // 2. f[k] = f[k-1] + f[k-2]
  74. // 3. 因为后面我们有f[k-2] 所以可以继续拆分 f[k-1] = f[k-3] + f[k-4]
  75. // 4. 即在f[k-2] 的前面进行查找 k -=2
  76. // 5. 即下次循环 mid = f[k - 1 - 2] - 1
  77. k -= 2;
  78. } else { // 找到
  79. // 需要确定,返回的是哪个下标
  80. if (mid <= high) {
  81. return mid;
  82. } else {
  83. return high;
  84. }
  85. }
  86. }
  87. if(a[low]==key) {
  88. return low;
  89. }
  90. else {
  91. return -1;
  92. }
  93. }
  94. }
  • 程序运行结果 ```java index=4

```