fuzzywuzzy 模块

https://zhuanlan.zhihu.com/p/53135935
https://blog.csdn.net/sunyao_123/article/details/76942809
gihub:https://github.com/seatgeek/fuzzywuzzy

中文问题的解决:https://segmentfault.com/q/1010000009868699

  1. >>> from fuzzywuzzy import fuzz
  2. >>> from fuzzywuzzy import process
  3. >>> fuzz.ratio("数据挖掘", "数据挖掘工程师")
  4. 73
  5. >>> fuzz.ratio("为什么我的是啊", "因为我不是啊")
  6. 62
  7. >>> title_list = [u"数据分析师", u"数据挖掘工程师", u"大数据开发工程师", u"机器 学习工程师",
  8. ... u"算法工程师", u"数据库管理", u"商业分析师", u"数据科学家", u"首席数据官",
  9. ... u"数据产品经理", u"数据运营", u"大数据架构师"]
  10. >>> process.extractOne(u"数据挖掘", title_list)
  11. ('数据挖掘工程师', 90)