基尼系数与洛伦兹曲线

这里的基尼系数与机器学习上决策树里用来决定分支的基尼系数其实是两个概念。机器学习里的基尼系数更准确的应该是基尼不纯度。

举个例子来说,如果画出国民收入的洛伦兹曲线,步骤为:

  1. 统计每个人的收入,A、B、C表示3个人,5、3、2表示收入 | 人 | 收入(万元) | | :—- | :—- | | A | 5 | | B | 3 | | C | 2 |
  1. 按照收入从低到高排列 | 人 | 收入 | | —- | —- | | C | 2 | | B | 3 | | A | 5 |
  1. 首先计算C,横坐标为1/3,表示这是第0.33百分位数,纵坐标为3/(2+3+5),然后计算B,横坐标为2/3,纵坐标为(3+2)/(2+3+5),最后计算C,横坐标为3/3,纵坐标为(5+3+2)/(2+3+5)。 | 人 | 收入 | 横坐标 | 纵坐标 | | —- | —- | —- | —- | | C | 2 | 1/3 | 2/(2+3+5) | | B | 5 | 3/3 | (2+3+5)/(2+3+5) | | A | 3 | 2/3 | (2+3)/(2+3+5) |

引用