强化学习正在改变人类社会的方方面面:基于强化学习的游戏AI 已经在围棋、星际争霸等游戏上战胜人类顶尖
    选手,基于强化学习的控制算法已经运用于机器人、无人机等设备,基于强化学习的交易算法已经部署在金融
    平台上并取得超额收益。由于同一套强化学习代码在使用同一套参数的情况下能解决多个看起来毫无关联的问
    题,所以强化学习常被认为是迈向通用人工智能的重要途径。在此诚邀相关专业人士研究强化学习,以立于人
    工智能的时代之巅。
    111.png
    《强化学习原理与python实现》PDF源代码
    《强化学习原理与python实现》PDF,249页,文字可复制;配套源代码。肖智清著
    下载:https://pan.baidu.com/s/1Qayw80Frd-tgMFsnBqIcKw
    提取码: pkj1
    444.png
    分为三个部分第1 章:介绍强化学习的基础知识与环境库Gym 的使用,并给出一个完整的编程实例。
    第2~9 章:介绍强化学习的理论和算法。采用严谨的数学语言,推导强化学习的基本理论,进而在理论的基础上
    讲解算法,并为算法提供配套的Python 实现。算法的讲解和Python 实现逐一对应,覆盖了所有主流的强化学习
    算法。

    第10 ~ 12 章:介绍多个综合案例,包括电动游戏、棋盘游戏和自动驾驶。环境部分涵盖Gym 库的完整安装和自
    定义扩展,也包括Gym 库以外的环境。算法部分涵盖了《自然H 科学》等权威期刊发表的多个深度强化学习明
    星算法。
    333.png
    完整地介绍了主流的强化学习理论。采用完整的数学体系,各章内容循序渐进,严谨地讲授强化学习的理论基
    础,主要定理均给出证明过程。基于理论讲解强化学习算法,覆盖了所有主流强化学习算法,包括资格迹等经
    典算法和深度确定性梯度策略等深度强化学习算法。
    采用一致的数学符号,但是当前更新策略的优劣只能等到跟踪失败或者跟踪过程成功结束才能够判断。监督学
    习不适于解决这种问题,因此以前的方法都是结合先验知识,人工设定更新策略。现在,强化学习提供了针对
    这个问题的可行方案。第二个领域是当下比较火热的医疗AI。在这个领域中,由于治疗方案的可行性必须通过
    对病人长期的观察才能确定,因此监督学习更多地适用于初次诊断。对于长期的治疗、复诊过程,必须采用更
    恰当的学习范式。
    555.png