极化SAR影像的极化特性与信息表达与自然图像具有极大的不同,因此基于深度学习的极化SAR影像解译在特征表征学习以及信息表达提取上需要更深入的研究。深度学习的输入通常是极化特征,如极化相干矩阵、极化协方差矩阵等,通过训练再进一步学习高层次的具有可分性的特征表达。构建适合于极化SAR影像解译的网络结构以及损失函数,突破极化SAR影像的信息表达问题,能有效的提高极化SAR影像解译的性能。极化SAR影像场景分类是极化SAR影像解译的重要应用。 PolSAR影像的监督分类一般采用softmax层输出的独热向量(one-hot vector)与标注计算交叉熵损失,指导网络根据真实标注进行特征学习。PolSAR影像无监督分类没有标注样本,需要特别设计的损失函数指导网络学习输入数据的具有区分性的特征表达。不管是监督还是无监督分类,在网络训练完成后,则无需损失函数,可直接输出分类的类别。 下图是基于LeNet-5的PolSAR影像分类框架:
PolSAR影像分类是将影像中的每个像素根据分类算法分成一种地物类型。对PolSAR影像中的一个像素进行分类时,通常取该像素邻域窗的低层次特征输入到深度学习模型并输出该像素的分类结果,可以更好的保持地物类型的空间信息。深度学习通常一次仅对一个像素进行分类。如果是对整景PolSAR影像进行分类,则每个像素的邻域窗数据依次输入到深度学习模型,获取所有像素的分类结果。首先,邻域窗中的像素类型并不一定是完全相同的,邻域窗中的地物相互关系信息表达没有得到充分利用。尽管邻域窗数据已经包含了一定的空间信息,但是一般方法都假设邻域窗张的地物类型是相同的,邻域窗中的地物之间的内在关系信息被忽略了。例如有两个相邻的像素,如果CNN将第一像素分为水域,然后只会再单独分类第二个像素,不会利用第一个像素与像素间的地物类型的关系信息。其次对整景PolSAR影像的像素依次分类,效率不高。一些深度学习方法看可以输出像素级的二维分类图,但是这些方法很少应用于PolSAR影像分类领域。 极化SAR影可以由极化相干矩阵T_3表征,极化相干矩阵是目前最常用的分类低层次特征之一,其形式如下:
一般的卷积神经网络对整景影像分类时,需要依次对每个像素进行分类,最后得到分类结果图。FFS-CNN可以对邻域窗所有像素进行分类,因此采用滑动窗口法对整景PolSAR影像进行分类。 SAR影像目视解译困难的主要原因有:第一,极化SAR影像伪彩图的颜色显示效果与光学遥感影像具有很大的不同,特别是单极化SAR影像不具有颜色信息;第二,极化SAR影像的相干斑噪声特征未出现在其他任何光学影像;第三,极化SAR影像特殊的侧视主动成像机制,会造成地形以及地物目标失真。如能将极化SAR影像可视化表达方式转换为类光学遥感影像,是解决极化SAR影像目视解译以及光学遥感影像信息缺失的一个重要途径。 注:以上内容选自《深度学习框架下的极化SAR影像信息表达与分类研究》王磊 武汉大学 博士学位论文
|