一、安装mecab命令
$ apt-get install mecab libmecab-dev mecab-ipadic$ apt-get install mecab-ipadic-utf8
注意:其中mecab-ipadic 和 mecab-ipadic-utf8 是日文词典和模型,可以选择安装或者不安装,基于需求而定。
二、ubuntu16.04安装python3
1.安装命令
apt-get update#安装add-apt-repositoryapt-get install python-software-propertiesapt-get install software-properties-common#添加ppa:fkrull/deadsnakes库add-apt-repository ppa:fkrull/deadsnakesapt-get update#安装apt-get install python3.5python --version#装pip3sudo apt-get install python3-pip
2.设置python3为默认版本
#直接执行这两个命令即可:update-alternatives --install /usr/bin/python python /usr/bin/python2 100update-alternatives --install /usr/bin/python python /usr/bin/python3 150#如果要切换到Python2,执行:update-alternatives --config python#按照提示输入选择数字回车即可。
三、安装ko-dic
mecab-ko-dic-2.0.1-20150920.tar.gz
tar -zvxf mecab-ko-dic-2.0.1-20150920.tar.gzcd mecab-ko-dic-2.0.1-20150920./autogen.sh#如果运行错误可参考:https://www.jianshu.com/p/cece3a18723d./configuremakemake install#测试,如果cd /usr/lib/mecab/dic文件夹下有mecab-ko-dic文件夹侧成功
四、安装断句包
unzip unzip sentence_splitter.zip#解压后,切换到文件夹下python setup.py install
五、安装konlpy包
pip3 install konlpy
六、安装mecab-python3
pip3 install mecab-python3
七、测试
>>> import MeCab>>> wakati = MeCab.Tagger("-Owakati")>>> wakati.parse("pythonが大好きです").split()['python', 'が', '大好き', 'です']>>> chasen = MeCab.Tagger("-Ochasen")>>> print(chasen.parse("pythonが大好きです"))python python python 名詞-固有名詞-組織が ガ が 助詞-格助詞-一般大好き ダイスキ 大好き 名詞-形容動詞語幹です デス です 助動詞 特殊・デス 基本形EOS
八、参考资料
1.mecab安装
http://www.52nlp.cn/mecab%E5%AE%89%E8%A3%85%E8%BF%87%E7%A8%8B%E4%B8%AD%E7%9A%84%E4%B8%80%E4%BA%9B%E5%9D%91#more-9208
2.python3安装
https://www.jianshu.com/p/e50e6d46ea62
3.测试
https://pypi.org/project/mecab-python3/#description
_
