增强学习与近似动态规划.pdf 本书内容包括:求解Markov链学习预测问题的时域差值学习算法和理论;求解连续空间马氏决策问题的梯度增强学习算法;求解马氏决策问题的进化-梯度混合增强学习算法;基于核的增强学习与近似动态规划方法;增强学习在移动机器人导航控制中的应用等。 叁号仓库 2022年07月18日 0 点赞 0 评论 7963 浏览