转自:https://blog.csdn.net/u013089490/article/details/84304732
ElasticSearch的ik分词器下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases。
分析器Analyzer:ik_smart,ik_max_work,
分词器Tokenizer:ik_smart,ik_max_work
1、安装ik分词器
安装ik分词器时注意版本与elasticsearch版本保持一致(https://github.com/medcl/elasticsearch-analysis-ik/releases)。选择下载版本如下图:
我们选择zip包进行下载,安装操作如下:
[root@wzy10 ~]# su - elk -s /bin/bash#解压[elk@wzy10 ~]$ unzip elasticsearch-analysis-ik-6.2.x.zip#unzip后的目录名称为elasticsearch[elk@wzy10 ~]$lldrwxrwxrwx 3 elk elk 213 May 6 2018 elasticsearch#把目录名改一下,防止安装别的插件时同名冲突;这里修改为ik-analyzer[elk@wzy10 ~]$ mv elasticsearch ik-analyzer[elk@wzy10 ~]$ mv ik-analyzer /usr/local/elasticsearch/plugins/[elk@wzy10 ~]$ cd /usr/local/elasticsearch/plugins/[elk@wzy10 plugins]$ lltotal 0drwxrwxrwx 3 elk elk 213 May 6 2018 ik-analyzer[elk@wzy10 plugins]$ cd ik-analyzer/[elk@wzy10 ik-analyzer]$ lltotal 1420-rw-r--r-- 1 elk elk 263965 May 6 2018 commons-codec-1.9.jar-rw-r--r-- 1 elk elk 61829 May 6 2018 commons-logging-1.2.jardrwxr-xr-x 2 elk elk 299 May 6 2018 config-rw-r--r-- 1 elk elk 51438 May 6 2018 elasticsearch-analysis-ik-6.2.4.jar-rw-r--r-- 1 elk elk 736658 May 6 2018 httpclient-4.5.2.jar-rw-r--r-- 1 elk elk 326724 May 6 2018 httpcore-4.4.4.jar-rw-r--r-- 1 elk elk 1805 May 6 2018 plugin-descriptor.properties
重启一下ElasticSearch
[elk@wzy10 ~]$ jps2546 Jps2458 Elasticsearch[elk@wzy10 ~]$ kill 2458[elk@wzy10 ~]$ /usr/local/elasticsearch/bin/start.sh
2、扩展词库
由于我们ElasticSearch安装目录是/usr/local/elasticsearch/,ik中文分词器的目录是/usr/local/elasticsearch/plugins/ik-analyzer,所以扩展词库文件/usr/local/elasticsearch/**plugins/ik-analyzer/config/IKAnalyzer.cfg.xml****。**<br />【默认**IKAnalyzer.cfg.xml**配置】
[elk@wzy10 ~]$ cat /usr/local/elasticsearch/plugins/ik-analyzer/config/IKAnalyzer.cfg.xml<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"><properties><comment>IK Analyzer 扩展配置</comment><!--用户可以在这里配置自己的扩展字典 --><entry key="ext_dict"></entry><!--用户可以在这里配置自己的扩展停止词字典--><entry key="ext_stopwords"></entry><!--用户可以在这里配置远程扩展字典 --><!-- <entry key="remote_ext_dict">words_location</entry> --><!--用户可以在这里配置远程扩展停止词字典--><!-- <entry key="remote_ext_stopwords">words_location</entry> --></properties>
【我们自定义】
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"><properties><comment>IK Analyzer 扩展配置</comment><!--用户可以在这里配置自己的扩展字典 --><entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry><!--用户可以在这里配置自己的扩展停止词字典--><entry key="ext_stopwords">custom/ext_stopword.dic</entry><!--用户可以在这里配置远程扩展字典 --><entry key="remote_ext_dict">location</entry><!--用户可以在这里配置远程扩展停止词字典--><entry key="remote_ext_stopwords">http://xxx.com/xxx.dic</entry></properties>
【注意】如果我们自定义分词器,文件必须保存为UTF-8格式的dic文件,首行换行否则会报错。
3、测试ik分词器


