Maxton‘s Blog

博客文档链接关于时间轴 English

返回

标签: #dqn

2026年2月21日

RL学习笔记：值函数近似

总结强化学习中值函数近似的核心概念，涵盖线性与非线性近似、状态分布假设与梯度优化方法，并梳理DQN及经验回放机制。

7 min 中文