一、安装mecab命令
$ apt-get install mecab libmecab-dev mecab-ipadic
$ apt-get install mecab-ipadic-utf8
注意:其中mecab-ipadic 和 mecab-ipadic-utf8 是日文词典和模型,可以选择安装或者不安装,基于需求而定。
二、ubuntu16.04安装python3
1.安装命令
apt-get update
#安装add-apt-repository
apt-get install python-software-properties
apt-get install software-properties-common
#添加ppa:fkrull/deadsnakes库
add-apt-repository ppa:fkrull/deadsnakes
apt-get update
#安装
apt-get install python3.5
python --version
#装pip3
sudo apt-get install python3-pip
2.设置python3为默认版本
#直接执行这两个命令即可:
update-alternatives --install /usr/bin/python python /usr/bin/python2 100
update-alternatives --install /usr/bin/python python /usr/bin/python3 150
#如果要切换到Python2,执行:
update-alternatives --config python
#按照提示输入选择数字回车即可。
三、安装ko-dic
mecab-ko-dic-2.0.1-20150920.tar.gz
tar -zvxf mecab-ko-dic-2.0.1-20150920.tar.gz
cd mecab-ko-dic-2.0.1-20150920
./autogen.sh
#如果运行错误可参考:https://www.jianshu.com/p/cece3a18723d
./configure
make
make install
#测试,如果cd /usr/lib/mecab/dic文件夹下有mecab-ko-dic文件夹侧成功
四、安装断句包
unzip unzip sentence_splitter.zip
#解压后,切换到文件夹下
python setup.py install
五、安装konlpy包
pip3 install konlpy
六、安装mecab-python3
pip3 install mecab-python3
七、测试
>>> import MeCab
>>> wakati = MeCab.Tagger("-Owakati")
>>> wakati.parse("pythonが大好きです").split()
['python', 'が', '大好き', 'です']
>>> chasen = MeCab.Tagger("-Ochasen")
>>> print(chasen.parse("pythonが大好きです"))
python python python 名詞-固有名詞-組織
が ガ が 助詞-格助詞-一般
大好き ダイスキ 大好き 名詞-形容動詞語幹
です デス です 助動詞 特殊・デス 基本形
EOS
八、参考资料
1.mecab安装
http://www.52nlp.cn/mecab%E5%AE%89%E8%A3%85%E8%BF%87%E7%A8%8B%E4%B8%AD%E7%9A%84%E4%B8%80%E4%BA%9B%E5%9D%91#more-9208
2.python3安装
https://www.jianshu.com/p/e50e6d46ea62
3.测试
https://pypi.org/project/mecab-python3/#description
_