背景介绍
- 是一种有监督式机器学习,即需要事先特征及对应打标label录入系统,机器学习其规律。
- 已知打标好的数据集合X,分为特征矩阵(X) + label标签(y)两个变量。
- 寻良好模型之后,然后使用predict来验证,系统猜测新数据;
- 输入与输出有些像LR,只是算法原理不同导致输出结果不一样。
代码
import numpy as np
X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
Y = np.array([1, 1, 1, 2, 2, 2])
from sklearn.naive_bayes import GaussianNB
clf = GaussianNB()
clf.fit(X, Y)
GaussianNB(priors=None, var_smoothing=1e-09)
print(clf.predict([[-0.8, -1]]))
clf_pf = GaussianNB()
clf_pf.partial_fit(X, Y, np.unique(Y))
print(clf_pf.predict([[-0.8, -1]]))