Table of Contents for The Mathematical Principles of Reinforcement Learning

Table of Contents for The Mathematical Principles of Reinforcement Learning
Penry引言
本笔记系统整理和总结了强化学习领域的核心数学原理,内容主要参考自B站课程:【强化学习的数学原理】课程:从零开始到透彻理解(完结)。课程由西湖大学工学院赵世钰老师主讲,涵盖了强化学习的基本概念、马尔可夫决策过程(MDP)、动态规划、蒙特卡洛方法等重要内容,本课程重点讲解的是 RL 的算法原理,适合希望深入理解强化学习本质的同学学习。赵老师的个人主页可参考:赵世钰。
相关资源与链接整理如下:
- 课程视频(知乎):https://www.zhihu.com/education/video-course/1574007679344930816?section_id=1574047391564390400
- 课程视频(B站):https://space.bilibili.com/2044042934
- 全英课程视频(YouTube):https://www.youtube.com/watch?v=ZHMWHr9811U&list=PLEhdbSEZZbDaFWPX4gehhwB9vJZJ1DNm8&index=2
- 书籍PDF与PPT下载(GitHub):https://github.com/MathFoundationRL/Book-Mathmatical-Foundation-of-Reinforcement-Learning
- 课程介绍(知乎):https://zhuanlan.zhihu.com/p/583392915
- 西湖大学实验室网站:https://shiyuzhao.westlake.edu.cn/
说明:建议搭配豆包浏览器阅读,因为该课程笔记中大多数依托于PPT撰写,以及结合个人理解,英文较多,可以借助于豆包划词工具。
目录
评论
匿名评论隐私政策
TwikooWaline
✅ 你无需删除空行,直接评论以获取最佳展示效果









