一、安装mecab命令

  1. $ apt-get install mecab libmecab-dev mecab-ipadic
  2. $ apt-get install mecab-ipadic-utf8

注意:其中mecab-ipadic 和 mecab-ipadic-utf8 是日文词典和模型,可以选择安装或者不安装,基于需求而定。

二、ubuntu16.04安装python3

1.安装命令

  1. apt-get update
  2. #安装add-apt-repository
  3. apt-get install python-software-properties
  4. apt-get install software-properties-common
  5. #添加ppa:fkrull/deadsnakes库
  6. add-apt-repository ppa:fkrull/deadsnakes
  7. apt-get update
  8. #安装
  9. apt-get install python3.5
  10. python --version
  11. #装pip3
  12. sudo apt-get install python3-pip

2.设置python3为默认版本

  1. #直接执行这两个命令即可:
  2. update-alternatives --install /usr/bin/python python /usr/bin/python2 100
  3. update-alternatives --install /usr/bin/python python /usr/bin/python3 150
  4. #如果要切换到Python2,执行:
  5. update-alternatives --config python
  6. #按照提示输入选择数字回车即可。

三、安装ko-dic

mecab-ko-dic-2.0.1-20150920.tar.gz

  1. tar -zvxf mecab-ko-dic-2.0.1-20150920.tar.gz
  2. cd mecab-ko-dic-2.0.1-20150920
  3. ./autogen.sh
  4. #如果运行错误可参考:https://www.jianshu.com/p/cece3a18723d
  5. ./configure
  6. make
  7. make install
  8. #测试,如果cd /usr/lib/mecab/dic文件夹下有mecab-ko-dic文件夹侧成功

四、安装断句包

sentence_splitter.zip

  1. unzip unzip sentence_splitter.zip
  2. #解压后,切换到文件夹下
  3. python setup.py install

五、安装konlpy包

  1. pip3 install konlpy

六、安装mecab-python3

  1. pip3 install mecab-python3

七、测试

  1. >>> import MeCab
  2. >>> wakati = MeCab.Tagger("-Owakati")
  3. >>> wakati.parse("pythonが大好きです").split()
  4. ['python', 'が', '大好き', 'です']
  5. >>> chasen = MeCab.Tagger("-Ochasen")
  6. >>> print(chasen.parse("pythonが大好きです"))
  7. python python  python 名詞-固有名詞-組織
  8. が   ガ    が   助詞-格助詞-一般
  9. 大好き ダイスキ 大好き 名詞-形容動詞語幹
  10. です  デス   です  助動詞 特殊・デス 基本形
  11. EOS

八、参考资料

1.mecab安装
http://www.52nlp.cn/mecab%E5%AE%89%E8%A3%85%E8%BF%87%E7%A8%8B%E4%B8%AD%E7%9A%84%E4%B8%80%E4%BA%9B%E5%9D%91#more-9208
2.python3安装
https://www.jianshu.com/p/e50e6d46ea62
3.测试
https://pypi.org/project/mecab-python3/#description

_