性能度量(performance measure):衡量模型泛化能力的标准

回归任务最常用的性能度量

均方误差(mean squared error)

更一般的,对于数据分布D和概率密度p(.),均方误差可描述为

分类任务最常用的性能度量

错误率

错误率指分类错误的样本占样本总数的比例

更一般的,对于数据分布D和概率密度p(.),错误率可描述为

精度

精度指分类正确的样本数占样本总数的比例

更一般的,对于数据分布D和概率密度p(.),精度可描述为