背景介绍

  • 是一种有监督式机器学习,即需要事先特征及对应打标label录入系统,机器学习其规律。
  • 已知打标好的数据集合X,分为特征矩阵(X) + label标签(y)两个变量。
  • 寻良好模型之后,然后使用predict来验证,系统猜测新数据;
  • 输入与输出有些像LR,只是算法原理不同导致输出结果不一样。


代码

  1. import numpy as np
  2. X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
  3. Y = np.array([1, 1, 1, 2, 2, 2])
  4. from sklearn.naive_bayes import GaussianNB
  5. clf = GaussianNB()
  6. clf.fit(X, Y)
  7. GaussianNB(priors=None, var_smoothing=1e-09)
  8. print(clf.predict([[-0.8, -1]]))
  9. clf_pf = GaussianNB()
  10. clf_pf.partial_fit(X, Y, np.unique(Y))
  11. print(clf_pf.predict([[-0.8, -1]]))

参考资料