| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 强化学习_经典论文&资料 -> 正文阅读 |
|
[人工智能]强化学习_经典论文&资料 |
汇总
文章目录PaperDQN Series【2010】Double Q-learning《Double Q-learning》 【2013】【DQN】《Playing Atari with Deep Reinforcement Learning》NIPS 2013 【2015】【Nature DQN】《Human-level control through deep reinforcement learning》Nature 2015 【2015】【Double DQN】《Deep Reinforcement Learning with Double Q-learning》 【2016】【Dueling DQN】《Dueling Network Architectures for Deep Reinforcement Learning》ICML 2016 【2016】【Prioritized DQN】《PRIORITIZED EXPERIENCE REPLAY》ICLR 2016 Policy GradientPG -> DPG -> DDPG 【2000】【PG】《Policy Gradient Methods for Reinforcement Learning with Function Approximation》 【2014】【DPG】《Deterministic Policy Gradient Algorithms》 【2015】【DDPG】《Continuous control with deep reinforcement learning》 【2017】【PPO】《Proximal Policy Optimization Algorithms》 Actor-Critic Series【2016】【A3C】《Asynchronous Methods for Deep Reinforcement Learning》 【2018】【SAC】《Soft Actor-Critic Algorithms and Applications》 AlphaGo Series (with MCTS)【2016】【AlphaGo】《Mastering the game of Go with deep neural networks and tree search》
【2017】【AlphaZero】《Mastering the game of Go without human knowledge》
Dyna Architecture【2008】【Dyna-2】 《Sample-Based Learning and Search with Permanent and Transient Memories》 Review
Recent【2021】【Mava】《Mava_a research framework for distributed multi-agent reinforcement learning》 【2021】【SVEA】《Stabilizing Deep Q-Learning with ConvNets and Vision Transformers under Data Augmentation》 OthersBook【Sutton】Reinforcement Learning: An Introduction 【肖智清】《强化学习:原理与Python实现》 Blogs【刘建平Pinard】【强化学习-专栏】 Slides【2016】【ICML】deep_rl_tutorial.pdf Course【UCL】UCL Course on RL |
|
|
上一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 19:41:18- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |