决策算法笔记

白天 夜间 首页 下载 阅读记录
  我的书签   添加书签   移除书签

21 离线信念状态规划 Offline Belief State Planning

浏览 95 扫码 分享 2023-11-23 23:46:00
  • 1. 完全观测价值估计 Fully Observable Value Approximation

    :::info

    :::

    1. 完全观测价值估计 Fully Observable Value Approximation

    21 离线信念状态规划 Offline Belief State Planning - 图1

    若有收获,就点个赞吧

    0 人点赞

    上一篇:
    下一篇:
    • 书签
    • 添加书签 移除书签
    • 1 引言
    • PART 1 概率推理
      • 2 表示 Representation
      • 3 推断 Inference
      • 4 参数学习 Parameter Learning
      • 5 结构学习 Structure Learning
      • 6 简单决策 Simple Decisions
    • PART 2 序列问题
      • 7 精确解方法 Exact Solution Methods
      • 8 近似价值函数 Approximate Value Functions
      • 9 在线规划 Online Planning
      • 10 策略搜索 Policy Search
    • PART 3 模型不确定性
      • 15 探索与利用 Exploration and Exploitation
      • 16 基于模型的方法 Model-Based Methods
      • 17 免模型的方法 Model-Free Methods
      • 18 模仿学习 Imitation Learning
    • PART 4 状态不确定性
      • 19 信念 Beliefs
      • 20 精确信念状态规划 Exact Belief State Planning
      • 21 离线信念状态规划 Offline Belief State Planning
    暂无相关搜索结果!

      让时间为你证明

      展开/收起文章目录

      分享,让知识传承更久远

      文章二维码

      手机扫一扫,轻松掌上读

      文档下载

      请下载您需要的格式的文档,随时随地,享受汲取知识的乐趣!
      PDF文档 EPUB文档 MOBI文档

      书签列表

        阅读记录

        阅读进度: 0.00% ( 0/0 ) 重置阅读进度

          思维导图备注