一、使用方法
GET /_analyze
{
"analyzer" : "standard",
"text" : "Quick Brown Foxes!"
}
二、写入时分词
在mapping中可以设置字段的分词器和查询的分词器
analyzer 指定字段的分词器
search_analyzer 指定字段在被查询时使用哪种分词器
三、查询时分词
analyzer 查询时指定用哪种分词器
四、查询时选择分词器的顺序
1.在查询语句里指定分词器analyzer优先使用
2.查询语句没有指定分词器,使用mapping中设置的search_analyzer类型
3.mapping中没有设置search_analyzer类型,使用字段默认的search_analyzer类型
4.默认search_analyzer也没有,使用mapping中设置的analyzer类型
以上情况分词器都不存在,使用标准分词器standard analyzer
五、中文分词器
下面排名根据 GitHub 上的 star 数排名
1.jieba
2.Hanlp
3.IK
4.Stanford 分词
5.ansj 分词器