强化学习(Reinforcement Learning)的方法分类
来源:互联网 发布:淘宝上买c10a配件违法 编辑:程序博客网 时间:2024/06/14 01:47
强化学习(Reinforcement Learning)的方法分类
从Andrew Ng的cs229公开课开始接触强化学习已经有一段时间了,但对于强化学习中的各种方法一直很混乱,有必要简单归类整理一下,涉及的强化学习方法有:
- Value Iteration 值迭代
- Policy Iteration 策略迭代
- Monte Carlo Learing 蒙特卡洛学习
- Q-learning
- DQN(Deep Q-learning Network)
- Sarsa
- Policy Gradient
- Actor-Critic
- DDPG(Deep Deterministic Policy Gradient)
- A3C(Asynchronous Advantage Actor-Critic)
所有的这些强化学习方法都是以马尔可夫决策过程(MDPs)为基础的
这些方法的具体总结以后有时间再做。
阅读全文
0 0
- 强化学习(Reinforcement Learning)的方法分类
- Reinforcement Learning 强化学习
- 强化学习Reinforcement Learning
- 强化学习(Reinforcement Learning)
- 深度强化学习(Deep Reinforcement Learning)的资源
- 深度强化学习(Deep Reinforcement Learning)的资源
- 深度强化学习(Deep Reinforcement Learning)的资源
- 深度强化学习(Deep Reinforcement Learning)的资源汇总
- 强化学习(reinforcement learning)教程
- 强化学习(reinforcement learning)教程
- 强化学习(Reinforcement Learning)知识整理
- 强化学习(Reinforcement learning)是什么?
- 强化学习(Reinforcement Learning)知识整理
- 19什么是强化学习(Reinforcement Learning)
- 强化学习 Reinforcement Learning 资料
- 模型汇总19 强化学习(Reinforcement Learning)算法基础及分类
- 强化学习(Reinforcement Learning, RL)初步介绍
- 纯干货11 强化学习(Reinforcement Learning)教材推荐
- 【NYOJ-91】 阶乘之和
- C++ primer阅读笔记------------字符串,向量和数组
- Python通过__new__实现单例设计
- 佳能MP4视频恢复方法
- Java多线程基础--02之 常用的实现多线程的两种方式
- 强化学习(Reinforcement Learning)的方法分类
- Funny Function
- Spinner弹出框遮挡住显示框的解决办法
- 欢迎使用CSDN-markdown编辑器
- add-apt-repository问题
- 1.1 数据结构
- R语言编程:阿里推笔试题之一
- 第二天总结
- java中的抽象类