精确模式:
全模式:
将句子中所有可以成词的词语都扫描出来,速度非常快,但不能解决歧义。
搜索引擎模式:
在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。def useJieba():<br /> import jieba<br /> str = "黄淮学院位于河南省驻马店市驿城区。"<br /> _# 全模式<br /> _str_list = jieba.cut(str,cut_all=True)<br /> print("全模式:","/".join(str_list))<br /> _# 精确模式 (默认)<br /> _str_list = jieba.cut(str, cut_all=False)<br /> print("精确模式:", "/".join(str_list))<br /> _# 搜索引擎模式<br /> _str_list = jieba.cut_for_search(str)<br /> print("搜索引擎模式:", "/".join(str_list))<br /> _# 隐马算法模式<br /> _str_list = jieba.cut(str,HMM=True)<br /> print("隐马算法模式:", "/".join(str_list))
调用及结果:
useJieba()