转自:https://blog.csdn.net/u013089490/article/details/84304732

ElasticSearch的ik分词器下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases
分析器Analyzer:ik_smart,ik_max_work,
分词器Tokenizer:ik_smart,ik_max_work

1、安装ik分词器

安装ik分词器时注意版本与elasticsearch版本保持一致(https://github.com/medcl/elasticsearch-analysis-ik/releases)。选择下载版本如下图:
elasticsearch安装篇(4):安装IKAnalyzer中文分词器 - 图1
我们选择zip包进行下载,安装操作如下:

  1. [root@wzy10 ~]# su - elk -s /bin/bash
  2. #解压
  3. [elk@wzy10 ~]$ unzip elasticsearch-analysis-ik-6.2.x.zip
  4. #unzip后的目录名称为elasticsearch
  5. [elk@wzy10 ~]$ll
  6. drwxrwxrwx 3 elk elk 213 May 6 2018 elasticsearch
  7. #把目录名改一下,防止安装别的插件时同名冲突;这里修改为ik-analyzer
  8. [elk@wzy10 ~]$ mv elasticsearch ik-analyzer
  9. [elk@wzy10 ~]$ mv ik-analyzer /usr/local/elasticsearch/plugins/
  10. [elk@wzy10 ~]$ cd /usr/local/elasticsearch/plugins/
  11. [elk@wzy10 plugins]$ ll
  12. total 0
  13. drwxrwxrwx 3 elk elk 213 May 6 2018 ik-analyzer
  14. [elk@wzy10 plugins]$ cd ik-analyzer/
  15. [elk@wzy10 ik-analyzer]$ ll
  16. total 1420
  17. -rw-r--r-- 1 elk elk 263965 May 6 2018 commons-codec-1.9.jar
  18. -rw-r--r-- 1 elk elk 61829 May 6 2018 commons-logging-1.2.jar
  19. drwxr-xr-x 2 elk elk 299 May 6 2018 config
  20. -rw-r--r-- 1 elk elk 51438 May 6 2018 elasticsearch-analysis-ik-6.2.4.jar
  21. -rw-r--r-- 1 elk elk 736658 May 6 2018 httpclient-4.5.2.jar
  22. -rw-r--r-- 1 elk elk 326724 May 6 2018 httpcore-4.4.4.jar
  23. -rw-r--r-- 1 elk elk 1805 May 6 2018 plugin-descriptor.properties

重启一下ElasticSearch

  1. [elk@wzy10 ~]$ jps
  2. 2546 Jps
  3. 2458 Elasticsearch
  4. [elk@wzy10 ~]$ kill 2458
  5. [elk@wzy10 ~]$ /usr/local/elasticsearch/bin/start.sh

2、扩展词库

  1. 由于我们ElasticSearch安装目录是/usr/local/elasticsearch/,ik中文分词器的目录是/usr/local/elasticsearch/plugins/ik-analyzer,所以扩展词库文件/usr/local/elasticsearch/**plugins/ik-analyzer/config/IKAnalyzer.cfg.xml****。**<br />【默认**IKAnalyzer.cfg.xml**配置】
  1. [elk@wzy10 ~]$ cat /usr/local/elasticsearch/plugins/ik-analyzer/config/IKAnalyzer.cfg.xml
  2. <?xml version="1.0" encoding="UTF-8"?>
  3. <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
  4. <properties>
  5. <comment>IK Analyzer 扩展配置</comment>
  6. <!--用户可以在这里配置自己的扩展字典 -->
  7. <entry key="ext_dict"></entry>
  8. <!--用户可以在这里配置自己的扩展停止词字典-->
  9. <entry key="ext_stopwords"></entry>
  10. <!--用户可以在这里配置远程扩展字典 -->
  11. <!-- <entry key="remote_ext_dict">words_location</entry> -->
  12. <!--用户可以在这里配置远程扩展停止词字典-->
  13. <!-- <entry key="remote_ext_stopwords">words_location</entry> -->
  14. </properties>

【我们自定义】

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
  3. <properties>
  4. <comment>IK Analyzer 扩展配置</comment>
  5. <!--用户可以在这里配置自己的扩展字典 -->
  6. <entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry>
  7. <!--用户可以在这里配置自己的扩展停止词字典-->
  8. <entry key="ext_stopwords">custom/ext_stopword.dic</entry>
  9. <!--用户可以在这里配置远程扩展字典 -->
  10. <entry key="remote_ext_dict">location</entry>
  11. <!--用户可以在这里配置远程扩展停止词字典-->
  12. <entry key="remote_ext_stopwords">http://xxx.com/xxx.dic</entry>
  13. </properties>

【注意】如果我们自定义分词器,文件必须保存为UTF-8格式的dic文件,首行换行否则会报错。

3、测试ik分词器

elasticsearch安装篇(4):安装IKAnalyzer中文分词器 - 图2
elasticsearch安装篇(4):安装IKAnalyzer中文分词器 - 图3