NFQ文献中 参考文献的作用
来源:互联网 发布:mac系统升级安装失败 编辑:程序博客网 时间:2024/06/06 02:05
[BM95] Boyan and Moore. Generalization in reinforcement learning: Safely approximating the value function. In Advances in Neural Information Processing Systems 7. Morgan Kaufmann, 1995.
运用多层感知器表示价值函数,所存在的问题
[EPG05] D. Ernst and and L. Wehenkel P. Geurts. Tree-based batch mode reinforcement learning. Journal of Machine Learning Research, 6:503–556, 2005.
NFQ是其中’Fitted Q Iteration’的special realisation
[Gor95] G. J. Gordon. Stable function approximation in dynamic programming. In A. Prieditis and S. Russell, editors, Proceedings of the ICML, San Francisco, CA, 1995.
定值迭代算法fitted value iteration algorithm,NFQ基于此
[Lin92] L.-J. Lin. Self-improving reactive agents based on reinforcement learning, planning and teaching. Machine Learning, 8:293–321, 1992.
运用多层感知器表示价值函数的成功案例;
’experience replay‘ technique
[LP03] M. Lagoudakis and R. Parr. Least-squares policy iteration. Journal of Machine Learning Research, 4:1107–1149, 2003.
倒立摆(5.1节)所需的样本,系统方程及参数;LSPI方法及其结果
[RB93] M. Riedmiller and H. Braun. A direct adaptive method for faster backpropagation learning: The RPROP algorithm. In H. Ruspini, editor, Proceedings of the IEEE International Conference on Neural Networks (ICNN), pages 586 – 591, San Francisco, 1993.
Rprop算法,一种用于批量学习的监督学习方法,训练Q函数
[Rie00] M. Riedmiller. Concepts and facilities of a neural reinforcement learning control architecture for technical process control. Journal of Neural Computing and Application, 8:323–338, 2000.
运用多层感知器表示价值函数的成功案例
[SB98] R. S. Sutton and A. G. Barto. Reinforcement Learning. MIT Press, Cambridge, MA, 1998.
爬山小车的模型;cartploe模型
[Tes92] G. Tesauro. Practical issues in temporal difference learning. Machine Learning, (8):257–277, 1992.
运用多层感知器表示价值函数的成功案例
- NFQ文献中 参考文献的作用
- 文献类型参考文献的文献标识码
- 文献综述参考文献的格式说明
- 社交化的文献、参考文献管理工具CiteULike
- word中自动生成参考文献引用及自动更新文献编号
- NoteExpress文献管理工具的安装与使用--参考文献管理(二)
- 文献标识码与参考文献
- [EndNote]如何将软件中参考文献条目与本地文献链接对应
- 解决pdf中翻译外文文献到word参考文献格式错误
- Latex 多个参考文献的引用以及文献字体大小调整方法
- 毕业论文中的“参考文献”获取(经验三---获取某篇文章的文献格式)
- 【链接】中医药文献语料库——参考文献
- word自动生成文献引用及参考文献
- 论文中参考文献中大写字母的含义
- word中删除参考文献前的横线
- 参考文献中各字母的含义
- word中管理论文引用的参考文献
- word中参考文献的引用方法
- coding.net 配置SSH公钥
- iOS KVC和KVO介绍
- 无法将bin文件夹下的东西拷贝到object中
- 汇总ionic 安卓底部tabs footer-bar 被键盘弹起解决方法
- linux查看所有的用户和组信息
- NFQ文献中 参考文献的作用
- Hexo骚操作:主题配置|搜索|评论|统计|图床
- (OK) 通过 git 命令,添加/删除/修改 文件/文件夹
- javascrip第三、四天学习总结数组和循环
- pycharm 教程(一)安装和首次使用
- js中输入数字自动货币格式化
- C++中函数指针与回调函数
- ssh免密码登录配置详解
- [FAQ10400]如何在小部件列表中隐藏某个widget或者shortcut?