
对于一家公司而言,数据量越来越多,如果快速去查找这些信息是一个很难的问题,在计算机领域有一个专门的领域IR(Information Retrival)研究获取信息,做信息检索。


1 技术选型

  • 搜索引擎服务使用 ElasticSearch
  • 提供的对外 web 服务选 Springboot web

    1.1 ElasticSearch

    Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

官方客户端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr,也是基于Lucene。


1.2 Spring Boot

Spring Boot makes it easy to create stand-alone, production-grade Spring based Applications that you can “just run”.2

现在 Spring Boot 在做 web 开发上是绝对的主流,其不仅仅是开发上的优势,在布署,运维各个方面都有着非常不错的表现,并且 Spring 生态圈的影响力太大了,可以找到各种成熟的解决方案。

1.3 ik分词器

ElasticSearch 本身不支持中文的分词,需要安装中文分词插件,如果需要做中文的信息检索,中文分词是基础,此处选了ik,下载好后放入 elasticSearch 的安装位置的 plugin 目录即可。

2 环境准备


  • 安装elasticSearch elasticsearch官网. 笔者使用的是7.5.1。
  • ik插件下载 ik插件github地址. 注意下载和你下载elasticsearch版本一样的ik插件。
  • 将ik插件放入elasticsearch安装目录下的plugins包下,新建报名ik,将下载好的插件解压到该目录下即可,启动es的时候会自动加载该插件。

ElasticSearch 实现站内全文搜索 - 图1
搭建 Spring Boot 项目 idea ->new project ->spring initializer
ElasticSearch 实现站内全文搜索 - 图2

3 项目架构

  • 获取数据使用ik分词插件
  • 将数据存储在es引擎中
  • 通过es检索方式对存储的数据进行检索
  • 使用es的java客户端提供外部服务

ElasticSearch 实现站内全文搜索 - 图3

4 实现效果

4.1 搜索页面

ElasticSearch 实现站内全文搜索 - 图4

4.2 搜索结果页面

ElasticSearch 实现站内全文搜索 - 图5

5 具体代码实现

5.1 全文检索的实现对象


5.2 客户端配置


5.3 业务代码编写


5.4 对外接口


5.5 页面



  1. <!DOCTYPE html>
  2. <html lang="en" xmlns:th="http://www.thymeleaf.org">
  3. <head>
  4. <meta charset="UTF-8" />
  5. <meta name="viewport" content="width=device-width, initial-scale=1.0" />
  6. <title>YiyiDu</title>
  7. <!--
  8. input:focus设定当输入框被点击时,出现蓝色外边框
  9. text-indent: 11px;和padding-left: 11px;设定输入的字符的起始位置与左边框的距离
  10. -->
  11. <style>
  12. input:focus {
  13. border: 2px solid rgb(62, 88, 206);
  14. }
  15. input {
  16. text-indent: 11px;
  17. padding-left: 11px;
  18. font-size: 16px;
  19. }
  20. </style>
  21. <!--input初始状态-->
  22. <style class="input/css">
  23. .input {
  24. width: 33%;
  25. height: 45px;
  26. vertical-align: top;
  27. box-sizing: border-box;
  28. border: 2px solid rgb(207, 205, 205);
  29. border-right: 2px solid rgb(62, 88, 206);
  30. border-bottom-left-radius: 10px;
  31. border-top-left-radius: 10px;
  32. outline: none;
  33. margin: 0;
  34. display: inline-block;
  35. background: url(/static/img/camera.jpg) no-repeat 0 0;
  36. background-position: 565px 7px;
  37. background-size: 28px;
  38. padding-right: 49px;
  39. padding-top: 10px;
  40. padding-bottom: 10px;
  41. line-height: 16px;
  42. }
  43. </style>
  44. <!--button初始状态-->
  45. <style class="button/css">
  46. .button {
  47. height: 45px;
  48. width: 130px;
  49. vertical-align: middle;
  50. text-indent: -8px;
  51. padding-left: -8px;
  52. background-color: rgb(62, 88, 206);
  53. color: white;
  54. font-size: 18px;
  55. outline: none;
  56. border: none;
  57. border-bottom-right-radius: 10px;
  58. border-top-right-radius: 10px;
  59. margin: 0;
  60. padding: 0;
  61. }
  62. </style>
  63. </head>
  64. <body>
  65. <!--包含table的div-->
  66. <!--包含input和button的div-->
  67. <div style="font-size: 0px;">
  68. <div align="center" style="margin-top: 0px;">
  69. <img src="../static/img/yyd.png" th:src = "@{/static/img/yyd.png}" alt="一亿度" width="280px" class="pic" />
  70. </div>
  71. <div align="center">
  72. <!--action实现跳转-->
  73. <form action="/home/query">
  74. <input type="text" class="input" name="keyword" />
  75. <input type="submit" class="button" value="一亿度下" />
  76. </form>
  77. </div>
  78. </div>
  79. </body>
  80. </html>


  1. <!DOCTYPE html>
  2. <html lang="en" xmlns:th="http://www.thymeleaf.org">
  3. <head>
  4. <link rel="stylesheet" href="https://cdn.staticfile.org/twitter-bootstrap/4.3.1/css/bootstrap.min.css">
  5. <meta charset="UTF-8">
  6. <title>xx-manager</title>
  7. </head>
  8. <body>
  9. <header th:replace="search.html"></header>
  10. <div class="container my-2">
  11. <ul th:each="article : ${articles}">
  12. <a th:href="${article.url}"><li th:text="${article.author}+${article.content}"></li></a>
  13. </ul>
  14. </div>
  15. <footer th:replace="footer.html"></footer>
  16. </body>
  17. </html>