第4章朴素贝叶斯法

4.1 朴素贝叶斯法的学习与分类
- 4.1.1 基本方法
- 4.1.2 后验概率最大化的含义

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集，首先基于特征条件独立假设学习输入输出的联合概率分布。然后基于此模型，对给定的输入第4章朴素贝叶斯法 - 图1 ，利用贝叶斯定理求出后验概率最大的输出第4章朴素贝叶斯法 - 图2

4.1 朴素贝叶斯法的学习与分类

4.1.1 基本方法

设输入空间第4章朴素贝叶斯法 - 图3 为第4章朴素贝叶斯法 - 图4 维向量的集合，输出空间为类标记集合第4章朴素贝叶斯法 - 图5 ，第4章朴素贝叶斯法 - 图6 是定义在输入空间上的随机变量，第4章朴素贝叶斯法 - 图7 是定义在输出空间上的随机变量。第4章朴素贝叶斯法 - 图8 是第4章朴素贝叶斯法 - 图9 和第4章朴素贝叶斯法 - 图10 的联合概率分布，训练数据集第4章朴素贝叶斯法 - 图11 由第4章朴素贝叶斯法 - 图12 独立同分布产生

朴素贝叶斯法通过训练数据集学习联合概率分布，具体地，先学习一下先验概率分布及条件概率分布，然后再得到联合概率分布；先验概率分布：第4章朴素贝叶斯法 - 图13 ；条件概率分布：第4章朴素贝叶斯法 - 图14

事实上，假设第4章朴素贝叶斯法 - 图15 可取值有第4章朴素贝叶斯法 - 图16 个，第4章朴素贝叶斯法 - 图17 可取值有第4章朴素贝叶斯法 - 图18 个，那么条件概率分布第4章朴素贝叶斯法 - 图19 的参数个数为第4章朴素贝叶斯法 - 图20 ，参数过多导致估计实际是不可行的。朴素贝叶斯法对条件概率分布作了较强的条件独立性假设，这一假设使朴素贝叶斯法变得简单，但有时会牺牲一定的准确率，具体地：
第4章朴素贝叶斯法 - 图21