简单来说就是分类的类别有多个,不再是二分,比如根据某些特征,什么温度、湿度、空气流动情况来预测天气,天气的label不能说是好天气和坏天气两种,而是分晴天、雨天、阴天,雪天等等,对于决策树或者从计算机的本质上来说,二分,0或者1是本质,计算机对于二分才是擅长的,那么接下来就有两种分类方法,一种是按照one vs rest
(晴天,(雨天、阴天、雪天)) ①
(雨天,(阴天、晴天、雪天)) ②
(阴天,(晴天、雨天、雪天)) ③
(雪天,(阴天、晴天、雨天)) ④
一种是按照one vs one
(晴天、雨天) ①
(晴天、阴天) ②
(晴天、雪天) ③
(雨天、阴天) ④
(雨天、雪天) ⑤
(阴天、雪天) ⑥
当我们得到测试数据套用one vs rest的model得到四种天气的概率,则四个概率中最大的就作为最终的预测结果,如
①:晴天=85%,非晴天=15%
②:雨天=75%,非雨天=25%
③:阴天=60%,非阴天=30%
④:雪天=5%,非雪天=95%
那么晴天的概率最大,预测为晴天;
one vs one 则是投票,出现次数最多的作为最终的预测结果,如:
①:晴天
②:阴天
③:雪天
④:阴天
⑤:雪天
⑥:阴天
因为阴天出现三次,次数是最多的,所以预测为阴天。