jieba提供了三种分词模式:

精确模式:

默认模式。试图将句子最精确地切开,适合文本分析。

全模式:

将句子中所有可以成词的词语都扫描出来,速度非常快,但不能解决歧义。
搜索引擎模式:
在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
def useJieba():<br /> import jieba<br /> str = "黄淮学院位于河南省驻马店市驿城区。"<br /> _# 全模式<br /> _str_list = jieba.cut(str,cut_all=True)<br /> print("全模式:","/".join(str_list))<br /> _# 精确模式 (默认)<br /> _str_list = jieba.cut(str, cut_all=False)<br /> print("精确模式:", "/".join(str_list))<br /> _# 搜索引擎模式<br /> _str_list = jieba.cut_for_search(str)<br /> print("搜索引擎模式:", "/".join(str_list))<br /> _# 隐马算法模式<br /> _str_list = jieba.cut(str,HMM=True)<br /> print("隐马算法模式:", "/".join(str_list))

调用及结果:

useJieba()
image.png