一.标题解读
FSDR: Frequency Space Domain Randomization for Domain Generalization 用于域泛化的频域域随机化
此论文发表在CVPR2021,它的归类为域泛化。 域泛化问题感觉是一个工业上很常见的问题。数据可能来自多个不同的数据源。或者说你的训练集是高清图像进行训练,实际的测试集却是较为模糊的图片。很多情况会导致训练域与实际的测试域不匹配的问题。
Frequency Space:频率空间 Domain:领域 Randomization:随机化 Domain Generalization:领域泛化
近些年关于频域与深度学习结合的文章是比较火热的,
二.作者学校简介
Jiaxing Huang, Dayan Guan, Aoran Xiao, Shijian Lu 最后一个是新加坡南洋理工大学计算机工程学院Shijian Lu教授,其他的作者应该是博士。(网上相关资料比较少) 通常论文作者打星号代表的是通讯作者,通讯作者还可以以致谢的形式标注,通讯作者是论文的总负责人,文章的成果是通讯作者的,说明思路是通讯作者的,而不是第一作者。 通讯作者一般承担课题的经费、设计、文章的书写等,他也是文章和研究材料的联系人。最重要的是,他担负着文章可靠性的责任。通讯作者的好处是能和外界建立更广泛的联系。
再介绍一下南阳理工大学:
南洋理工大学(Nanyang Technological University,简称:NTU),是新加坡的一所研究型大学,2020 QS世界大学排名第11名、2020、2021经济学人工商管理硕士(The Economist Global Full time MBA Ranking)亚洲第1名;2021 US NEWS能源与燃料、纳米科学、材料科学学科世界排名第1。 计算机学院:更偏向于那些喜欢开发、设计和实施人工智能系统的学生,同时培养学生对人工智能在项目管理和决策方面的深刻理解。。核心课程以基础为重点,侧重于人工智能知识的基础,如机器学习和深度学习,同时还有广泛的不同领域的选修课程,如图像、视频、文本和物联网数据,可以加深学生对AI理解和知识的拓展。
三.摘要解读
提取信息:
将源图像转移到空间空间中的不同风格以学习领域无关的特征的领域随机化已经被广泛研究。
说明自己研究的领域之前有人涉及,是一个热门的研究领域。
然而,大多数现有的随机化使用通常缺乏控制的GANs,甚至不希望地改变图像的语义结构。
解释GANs:(Generative Adversarial Nets)生成对抗网络 – GANs 是最近2年很热门的一种无监督算法,他能生成出非常逼真的照片,图像甚至视频。我们手机里的照片处理软件中就会使用到它。 指出之前的研究有不足之处,引出自己的研究。(论文基本写作套路)
受将空间图像转换成多个频率分量的JPEG思想的启发,我们提出了频率空间域随机化(FSDR),它通过保持域不变频率分量(DIFs)和随机域可变频率分量(DVFs)来随机化频率空间中的图像。
核心思想:保持域不变频率分量(DIFs)和随机域可变频率分量(DVFs)来随机化频率空间中的图像。 DIFs:(Distributed Inter-frame Spacing)分布式帧间间隙,在CSMA/CA中,媒体空闲,站点就在等待一个设定的时间即DIFS。 DVFs:(Dynamic voltage and frequency scaling)动态电压频率调整。
FSDR有两个独特的特点: 1)它将图像分解为DIFs和DVFs,允许对它们进行显式访问和操作,以及更可控的随机化; 2)对图像的语义结构和领域不变特征的影响最小。
我们统计检验了FCs的域方差和不变性,并设计了一个通过迭代学习动态识别和融合DIFs和DVFs的网络。
迭代学习:iterative learning
在多个领域泛化分割任务上的广泛实验表明,FSDR实现了优越的分割,并且其性能甚至与在训练中访问目标数据的领域自适应方法相当。 图一:我们提出的频率-空间域随机化(FSDR)通过离散余弦变换(DCT)将图像转换为多个频率分量(FCs),并识别域可变FCs(DVF)和域不变FCs(DIF)。这种显式隔离允许它随机化DVF,同时在训练中保持DIF不变,这通常会导致更具普遍性的模型。传统的空间域随机化(SSDR)在不分离和保留域不变特征的情况下将图像作为一个整体进行随机化,从而产生次优分割。绿色、蓝色和红色框分别表示DIF、DVF和随机化DVF
研究结果的图,用虚线框分类显得清晰很有条理。这是一个图像处理的过程。读完摘要还是比较懵,专业术语过多,很多都是我不知道的领域。接下来我需要查阅更多资料,对于术语缩写和陌生的专业术语需要进一步了解才能继续下一步的阅读。
|