返回
总结强化学习中值函数近似的核心概念,涵盖线性与非线性近似、状态分布假设与梯度优化方法,并梳理DQN及经验回放机制。
reinforcement learning
value function approximation
dqn
学习笔记