在sklearn中包含四种评价尺度,分别为mean_squared_error、mean_absolute_error、explained_variance_score 和 r2_score。
做回归分析,常用的误差主要有均方误差根(RMSE)和R-平方(R2)。
(1)MSE:数理统计中均方误差是指参数估计值与参数真值之差平方的期望值,记为MSE。MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据具有更好的精确度。与此相对应的,还有均方根误差RMSE等。
其中,下同。
(2)RMSE:预测值与真实值的误差平方根的均值。
(3)R2方法:将预测值跟只使用均值的情况下相比,看能好多少。其区间通常在(0,1)之间。
模型越好:r2→1
模型越差:r2→0
0表示还不如不预测,直接取均值的情况,而1表示所有预测跟真实结果完美匹配的情况。
用法示例如下:
from sklearn.metrics import r2_score
y_true = [1,2,4]
y_pred = [1.3,2.5,3.7]
r2_score(y_true,y_pred)