AI

白天 夜间 首页 下载 阅读记录
  我的书签   添加书签   移除书签

RL(9):高效TD方法-Eligibility Traces

浏览 76 扫码 分享 2022-07-23 00:29:43

若有收获,就点个赞吧

0 人点赞

上一篇:
下一篇:
  • 书签
  • 添加书签 移除书签
  • 机器学习
    • 过拟合理解的N个阶段
  • 深度强化学习(DRL)相关
    • RL(1) : 基础模型 - FMDP
    • RL(2) : 基于模型的求解 - 动态规划(DP)方法
    • RL(3) : 无模型的求解 - Monte Carlo方法
    • RL(4) : 1-step时序差分 - DP和MC思想的结合
    • RL(5) : n-step时序差分 - 整合MC方法和1步TD方法
    • RL(6) : 极大状态空间的求解 - Value-function Approximation
    • RL(7):极大状态空间的on-policy控制方法
    • RL(8):极大状态空间的off-policy控制方法
    • RL(9):高效TD方法-Eligibility Traces
    • RL(10):基于策略的控制方法-Policy Gradient
暂无相关搜索结果!

    让时间为你证明

    展开/收起文章目录

    分享,让知识传承更久远

    文章二维码

    手机扫一扫,轻松掌上读

    文档下载

    请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
    PDF文档 EPUB文档 MOBI文档

    书签列表

      阅读记录

      阅读进度: 0.00% ( 0/0 ) 重置阅读进度

        思维导图备注