IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 一种鲁棒变形卷积神经网络图像去噪 -> 正文阅读

[人工智能]一种鲁棒变形卷积神经网络图像去噪

目录

一、相关工作

二、方法

2.1、网络体系结构

2.2、损失函数

2.3、可变形块(DB)

2.4、增强的块(EB)

2.5、残差块(RB)

三、实验


一、相关工作

用于图像应用的基于CNNs的灵活内核

????????CNN倾向于通过增加网络深度或宽度来提高性能,但这会增加训练成本;而轻量级CNN使用更小的卷积来减少计算成本,但会降低性能。为了解决这一问题,有人提出了动态卷积技术。该方法通过一种注意机制来动态融合并行卷积核,而不是通过某个核来提取显著特征。即一种注意机制可以根据不同的输入动态调整每个核的权重,增强得到的特征的表达能力。

????????另外,有人还提出了变形卷积技术。Chen等人[39]利用不同注意机制的相互依赖关系定义了可变形机制,提高了图像分割中单一泛化卷积的能力。Yu等人[40]提出了一种可变形的注意力来增强目标模板和搜索图像之间的上下文信息和相互依赖性,用于目标跟踪。受此启发,在CNN中使用可变形卷积来提高预测去噪图像的清晰度。

二、方法

2.1、网络体系结构

????????本文提出了一种鲁棒变形去噪CNN(RDDCNN),它由一个DB、一个增强块(EB)和一个RB组成,如图1所示:

由于卷积运算可能会改变已损坏图像中噪声的原始分布,这可能会增加图像去噪的训练难度。因此提出了12层DB,通过可变形和叠加的卷积结构,根据周围像素的关系提取出更有代表性的噪声特征。为了以更低的成本挖掘更多的结构信息,5层EB可以通过扩展卷积促进上下文交互,从而提取出更鲁棒的噪声信息,从而增强RDDCNN的学习能力。为了解决长期依赖问题,RB被用来增强浅层对深层的记忆能力,并构建一个潜在的干净图像。下式(1)可以直观地表达这一过程:

其中I_n表示噪声图像,I_c表示干净图像。

2.2、损失函数

损失如下:

式中的I分别是噪声图像和相对应的干净图像。

2.3、可变形块(DB)

????????简而言之,这个模块可以用下式来表示:

其中DC和R分别表示可变形卷积和ReLU,C和B分别表示卷积层和BN。

? ? ? ? 这个模块中除了可变形卷积都很常规,下面介绍它的详细信息。

一个标准的卷积运算可以表示为式(4):

其中(p_x,p_y)表示一个给定的核w的中心点的位置。它的大小设置为3 x 3。X表示得到的特征图。N为X中得到的特征的像素总数,\Delta x_k表示p_x在水平方向上的偏移,\Delta y_k表示p_y在垂直方向上的偏移。\Delta x_k ,\Delta y_k \in \{-1,0,1\}

但对于一个3 × 3核的可变形卷积,如下图所示:

式中(L_{xk},L_{yk})为第k点的学习偏移量。通过对上述公式的分析,可以看出变形卷积在获取更多上下文信息方面具有良好的性能。

2.4、增强的块(EB)

? ? ? ? 这个过程可以用下式表示:

式中DC为扩张卷积,C和B分别表示卷积层和BN。

2.5、残差块(RB)

? ? ? ? 过程如下式所述:

三、实验

代码:GitHub - hellloxiaotian/RDDCNN: A robust deformed CNN for image denoising (CAAI Transactions on Intelligence Technology,2022)

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-07-20 18:51:12  更:2022-07-20 18:53:23 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 0:46:10-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码