徐昕

首页

徐昕

本书内容包括：求解Markov链学习预测问题的时域差值学习算法和理论；求解连续空间马氏决策问题的梯度增强学习算法；求解马氏决策问题的进化-梯度混合增强学习算法；基于核的增强学习与近似动态规划方法；增强学习在移动机器人导航控制中的应用等。

叁号仓库 2022年07月18日 0 点赞 0 评论 7963 浏览