gensim - 《深度学习》

Word2Vec模块

from gensim.models import Word2Vec,KeyedVectors
#训练
model=Word2Vec([a,b,c],size,window,min_count,workers)
#a,b,c 是分词后的list
#size是embedding size
#min_count是最小词频
#保存
model.wv.save_word2vec_format('...bin',binary=Ture)
#加载
model=KeyedVectors.laod_word2vec_format('...bin',binary=Ture,unicode_erros='ignore')
#vocab查看
model.vocab.keys()
#embedding 查询
model[word]
#相似度查询
model.similarity(word1,word2)
#近义词和反义词相似度最接近的词查询
model.most_similar(positive,negative,top)
#计算与其他word相似度最低的
model.doesnt_match([word1,word2,..])

https://mp.weixin.qq.com/s/VGgnoyMrPOKP5wkxtAMpyw?utm_medium=hao.caibaojian.com&utm_source=hao.caibaojian.com