有监督学习(分类、回归)无监督学习(聚类)强化学习 有监督学习(分类、回归) 无监督学习(聚类) 强化学习强化学习会在没有任何标签的情况下,通过先尝试做出一些行为得到一个结果,通过这个结果是对还是错的反馈,调整之前的行为,就这样不断的调整,算法能够学习到在什么样的情况下选择什么样的行为可以得到最好的结果。