• 贝叶斯英国数学家
  • 算法源于解决“逆概”问题的文章

    概率问题

    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png

    贝叶斯公式

    image.png

    拼写纠正

    image.png
    image.png
    P(h):先验概率,这个词出现的概率
    P(D|h):这个词被用户输错的概率
    p(D):用户输入这个词的概率(后面可以约掉)
    image.png
    image.png

    模型比较理论

    image.png
    image.png

    垃圾邮件过滤实例

    image.png
    image.png
    image.png

  • 朴素贝叶斯是一种变通式的假设

    Python实现(拼写检查)

    总体效果

    image.pngimage.png
    image.png

    求解问题

    image.png
    image.png

    检索词频

    image.png

    编辑距离

    image.png

  • 编辑距离为1有四种可能(增删改换)

image.png
image.png
image.png

  • 借助known实现优先级