徐昕

增强学习与近似动态规划.pdf

本书内容包括:求解Markov链学习预测问题的时域差值学习算法和理论;求解连续空间马氏决策问题的梯度增强学习算法;求解马氏决策问题的进化-梯度混合增强学习算法;基于核的增强学习与近似动态规划方法;增强学习在移动机器人导航控制中的应用等。