分类：reinforce learning - Dekel'Blog

- 主页
- 分类
- 标签
- 归档
- 友链
- 关于
- 日间/夜间模式

Dekel'Blog

奔赴山海，保持热爱

强化学习（二）状态值与贝尔曼方程

在学习强化学习（Reinforcement Learning, RL）的过程中，状态值（State Value）和贝尔曼方程（Bellman Equation）是两个非常核心的概念。它们不仅是理论的基石，也是后续理解 Q-learning、策略迭代和价值迭代等算法的基础。

2025-09-09 reinforce learning

粘贴文本
全选文本
剪切文本
复制文本
站内搜索
必应搜索
新标签页打开
复制链接地址
复制图片
谷歌识图
分类
标签
主页

暗黑模式
打印页面
阅读模式