强化学习并不是某一种特定的算法,而是一类算法的统称。
    如果用来做对比的话,他跟监督学习,无监督学习 是类似的,是一种统称的学习方式。
    强化学习 - 图1
    强化学习算法的思路非常简单,以游戏为例,如果在游戏中采取某种策略可以取得较高的得分,那么就进一步「强化」这种策略,以期继续取得较好的结果。这种策略与日常生活中的各种「绩效奖励」非常类似。我们平时也常常用这样的策略来提高自己的游戏水平。
    image.png