IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 【强化学习/gym】(二)一些强化学习的框架或代码 -> 正文阅读

[人工智能]【强化学习/gym】(二)一些强化学习的框架或代码

说在前面

测试环境：windows10
基础框架：torch(th)和tensorflow(tf)
说明：博主对本文所涉及的框架以及代码都进行了一定的尝试或者接触，但是并不是所有都在自定义环境中运行过。

Keras(tf)

keras rl
Keras文档中有四篇关于强化学习的例子，涉及的算法是Actor Critic、DDPG、DQN、PPO
这几个例子代码都比较简洁，并且有清晰明了的说明，便于学习。

TensorFlow(tf)

AC
tensorflow的官方教程中也有一个强化学习的例子，它是用Jupyter Notebooks写的，优点是你可以直接在colab中运行。

TensorFlow Agents(tf)

tfagents
tensorflow对rl的一个封装。
但是说实话，用起来感觉不是特别舒服。就env它就封装了两层（gym.env→pyenv→tfenv，可能是因为我从gym.env上手的吧）
offline rl：~~可能支持~~
imitation learning：好像只有behavior cloning
算法

Ray(tf&th)

Ray
Ray的主要目的是分布式。
它里面有个rllib的库，初步看来功能强大，实际接触后一大堆配置。
offline rl：支持
imitation learning：目前没看到相关资料
算法
一大堆，具体看这里

Stable Baselines(tf1.x)

stable-baselines
源自OpenAI Stable Baselines，目前仅支持tf1.x
offline rl：目前没看到相关资料
imitation learning：支持
算法

Stable Baselines3(th)

stable-baselines3
Stable Baselines的下一个主版本
offline rl：目前没看到相关资料
imitation learning：支持
算法

d3rlpy(th)

d3rlpy
一个专门用于offline rl的库，也支持online。
offline rl：当然支持
imitation learning：目前只看到behavior cloning
算法
这里

tf2rl(tf2.x)

tf2rl
一些使用tensorflow2实现的强化学习算法
offline rl：本身没有相关说明
imitation learning：支持

算法

Algorithm	Dicrete action	Continuous action	Support	Category
VPG, PPO	?	?	GAE	Model-free On-policy RL
DQN (including DDQN, Prior. DQN, Duel. DQN, Distrib. DQN, Noisy DQN)	?	-	ApeX	Model-free Off-policy RL
DDPG (including TD3, BiResDDPG)	-	?	ApeX	Model-free Off-policy RL
SAC	?	?	ApeX	Model-free Off-policy RL
CURL, SAC-AE	-	?	-	Model-free Off-policy RL
MPC, ME-TRPO	?	?	-	Model-base RL
GAIL, GAIfO, VAIL (including Spectral Normalization)	?	?	-	Imitation Learning

Coach

intel coach
这个库我只是看了下，没有尝试（因为只能在ubuntu上用）。看起来很强大。
算法选择，这个页面可以为选择算法提供一些帮助。
offline rl：支持
imitation learning：支持
算法

PARL

parl
百度家的强化学习库，目前还没有试过

待续…

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

上一篇文章下一篇文章查看所有文章

加:2021-07-26 12:05:46 更:2021-07-26 12:05:57

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2025年11日历

-2025/11/27 7:32:43-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码