| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【论文阅读】深度强化学习的攻防与安全性分析综述 -> 正文阅读 |
|
[人工智能]【论文阅读】深度强化学习的攻防与安全性分析综述 |
文章目录一.论文信息题目: 深度强化学习的攻防与安全性分析综述 发表年份: 2022 期刊/会议: 自动化学报 论文链接: 深度强化学习的攻防与安全性分析综述 作者信息: 陈晋音、章燕、王雪柯、蔡鸿斌、王珏、纪守领 二.论文结构
三.论文内容摘要深度强化学习是人工智能领域新兴技术之一, 它将深度学习强大的特征提取能力与强化学习的决策能力相结合, 实现从感知输入到决策输出的端到端框架, 具有较强的学习能力且应用广泛. 然而, 已有研究表明深度强化学习存在安全漏 洞, 容易受到对抗样本攻击. 为提高深度强化学习的鲁棒性、实现系统的安全应用, 本文针对已有的研究工作, 较全面地综 述了深度强化学习方法、对抗攻击、防御方法与安全性分析, 并总结深度强化学习安全领域存在的开放问题以及未来发展的 趋势, 旨在为从事相关安全研究与工程应用提供基础. 1 深度强化学习方法2 深度强化学习的攻击方法攻击实现的场景: Atari游戏场景以及自动导航的地图等场景上实现。 攻击方法分类: 观测攻击、奖励攻击、动作攻击、环境攻击、策略攻击。
2.1 基于观测的攻击2.1.1 FGSM 攻击: 2.1.2 策略诱导攻击: 2.1.3 战略时间攻击: 攻击概述: 4 深度强化学习的安全性分析目前存在两个问题: 5 应用平台与安全性评估指标5.1 深度强化学习的环境基准OpenAI Gym、Johnson、OpenSpiel、James、MuJoCo。 5.2 深度强化学习的算法实现基准OpenAI Baseline [80] 提供了几种当下最流行的深度强化学习算法的实现, 包括 DQN、TRPG、PPO 等。 Rllab [81]提供了各种各样的连续控制任务以及针对连续控制任务的深度强化学习算法基准。 Dopamine [82] 是用于快速实现强化学习算法原型制作的研究框架, 它旨在满足用户对小型、易处理代码库的需求. 5.3 深度强化学习的攻击基准CleverHans [83] 、Foolbox [84] 都提供了制造对抗样 本和对抗训练的标准化实现, 可以用来量化和比较 机器学习模型之间的鲁棒性. 但是这两者只能用于 对深度强化学习中的状态进行攻击, 并不能涵盖奖 励、动作等强化学习特有的环节. 5.4 深度强化学习的安全性评估基准攻击指标:奖励、损失、成功率、精度 6 未来研究方向6.1 攻击方法已有的面向深度学习的攻击方法中, 迭代攻击方法的性能相对较优, 但是迭代方法计算代价太高, 不能满足 DRL 系统实时预测的需求. 此外, 与传统 DNN 模型类似, 一些大型的如金融交易领域的 DRL 系统通常会被部署到云平台上. 这些领域的环境模型与训练数据常常具有非常高的 价值, 攻击者未来可以尝试以访问云平台公用 API 的方式进行模型与训练数据的窃取. 6.2 防御方法深度学习主要通过修改模型输入、目标函数以及网络结构这三类方法来实现防御效果. 但是, 深度学习的大多数防御方法不能满足 DRL 的实际应用场景中, 尤其是在多智能体的任务场景中. 针对 DRL 的防御, 之后的研究可能: 6.3 安全性分析深度学习(DL)在攻防的分析上已经提出了许多指标, 如:对抗类别平均置信度、平均结构相似度、分类精确方差等. 而对深度强化学习( DRL) 的攻击与防御的实验结果主要还是以简单的平均回合奖励、奖励值的收敛曲线来进行评估. 这样单一、表面的指标不能够充分说明 DRL 模型的鲁棒性, 未来还需要提出更深层的评估 标准, 用以展现决策边界、环境模型在防御前后的不同. 目前在 DL 领域, 已经有研究人员推出了一些模型测试评估平台, 这些平台集成了目前对 DL 模型的攻击方法与防御方法, 并以现有的模型安全指标对模型进行安全性分析. DRL 领域也可以结合本身的特点, 搭建相应的攻防安全分析平台, 并添加 DRL 特有的测试需求, 如对系统的环境建模误差进行分析、针对不同的系统生成标准的连续测试场景等. |
|
|
上一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/25 20:39:05- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |