IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 傅里叶变换用于特征匹配+相似性度量应用总结 -> 正文阅读

[人工智能]傅里叶变换用于特征匹配+相似性度量应用总结

最近经交流被问到傅里叶变换用于特征匹配的具体原理、及在解决分类问题时,为何欧式距离可以用于n-1维向量空间的相似性度量,奈何一时无语凝噎,难以用简洁通俗的语言来解释,故在此总结留念:

1.FFT用于特征匹配(即相位相关法)

图像配准的基本问题是找出一种图像转换方法,用以纠正图像的形变。造成图像形变的原因多种多样,例如对于遥感图像而言,传感器噪声、由传感器视点变化或平台不稳定造成的透视变化、被拍摄物体的移动、变形或生长等变化、闪电和大气变化,以及阴影和云层遮盖都使图像产生不同形式的形变。正是图像形变原因和形式的不同决定了多种多样的图像配准技术。

迄今已报道了多种图像配准方法,主要有互相关法、傅立叶变换法、点映射法口脚外和弹性模型法。其中傅立叶变换法基于傅立叶变换的相位匹配是利用傅立叶变换的性质而出现的一种图像配准方法。图像经过傅立叶变换,由空域变换到频率缘则两组数据在空何上的相关运算可以变为频谱的复数乘法运算,同时图像在变换域中还能获得在空域中很难获得的特征。
划重点 – 平移不影响傅氏变换的幅值(谱),对应的幅值谱和原图像是一样的。旋转在傅氏变换中是小变量。根据傅氏变换的旋转特性,旋转一幅图,在频域相当于对这幅图的傅氏变换做相同的旋转。使用频域方法的好处是计算简单,速度快(可使用MIT的fftw库),同时傅立叶变换可以采用方法提高执行的速度。因此,傅氏变换是图像配准中常用的方法之一。下面我们就具体分析当图像发生平移、旋转和缩放时,图像信号在频域中的表现。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
通过求取互功率谱的傅立叶反变换,得到一个狄拉克函数(脉冲函数),再寻找函数峰值点对应的坐标,即可得到我们所要求得的配准点。实际上,在计算机处理中,连续域要用离散域代替,这使得狄拉克函数转化为离散时间单位冲击函数序列的形式。在实际运算中,两幅图像互功率谱相位的反变换,总是含有一个相关峰值代表两幅图像的配准点,和一些非相关峰值,相关峰值直接反映两幅图像间的一致程度。更精确的讲,相关峰的能量对应重叠区域的所占百分比,非相关峰对应非重叠区域所占百分比。由此我们可以看出,当两幅图像重叠区域较小时,采用本方法就不能检测出两幅图像的平移量。
在这里插入图片描述
算法流程:
在这里插入图片描述
调用opencv实现代码:

void PhaseCorrelation2D(const BYTE *signal,//原信号  
    const BYTE *pattern,//带配准信号  
    int &height_offset,//高的偏移量  
    int &width_offset)//宽的偏移量  
{  
  
    fftw_complex *signal_img = (fftw_complex*)fftw_malloc(sizeof(fftw_complex)*nRow*nCol);  
    fftw_complex *pattern_img = (fftw_complex*)fftw_malloc(sizeof(fftw_complex)*nRow*nCol);  
  
    for (int i = 0; i < nRow*nCol; i++)  
    {  
        signal_img[i][0] = signal[i];  
        signal_img[i][1] = 0;  
    }  
    for (int j = 0; j < nRow*nCol; j++)  
    {  
        pattern_img[j][0] = pattern[j];  
        pattern_img[j][1] = 0;  
    }  
  
    // 对两幅图像傅里叶变换  
    fftw_plan signal_forward_plan = fftw_plan_dft_2d(nRow, nCol, signal_img, signal_img,  
        FFTW_FORWARD, FFTW_ESTIMATE);  
    fftw_plan pattern_forward_plan = fftw_plan_dft_2d(nRow, nCol, pattern_img, pattern_img,  
        FFTW_FORWARD, FFTW_ESTIMATE);  
    fftw_execute(signal_forward_plan);  
    fftw_execute(pattern_forward_plan);  
  
    // 求互功率谱  
    fftw_complex *cross_img = (fftw_complex*)fftw_malloc(sizeof(fftw_complex)*nRow*nCol);  
    double temp;  
    for (int i = 0; i < nRow*nCol; i++)  
    {  
        cross_img[i][0] = (signal_img[i][0] * pattern_img[i][0]) -   
            (signal_img[i][1] * (-1.0*pattern_img[i][1]));  
        cross_img[i][1] = (signal_img[i][0] * (-1.0*pattern_img[i][1])) +   
            (signal_img[i][1] * pattern_img[i][0]);  
        temp = sqrt(cross_img[i][0] * cross_img[i][0] + cross_img[i][1] * cross_img[i][1]) + 0.001;  
        cross_img[i][0] /= temp;  
        cross_img[i][1] /= temp;  
    }  
  
    //对互功率谱求反变换  
    fftw_plan cross_backward_plan = fftw_plan_dft_2d(nRow, nCol, cross_img, cross_img,  
        FFTW_BACKWARD, FFTW_ESTIMATE);  
    fftw_execute(cross_backward_plan);  
  
    // 释放内存  
    fftw_destroy_plan(signal_forward_plan);  
    fftw_destroy_plan(pattern_forward_plan);  
    fftw_destroy_plan(cross_backward_plan);  
    fftw_free(signal_img);  
    fftw_free(pattern_img);  
  
    double *cross_real=new double[nRow*nCol];  
    for (int i = 0; i < nRow*nCol; i++)  
        cross_real[i] = cross_img[i][0];  
  
    int max_loc = 0;//准备存放最大值的位置坐标(注意,只有一个值)  
    double max_vlaue = 0.0;  
    for (int i = 0; i < nRow*nCol; i++)  
    {  
        if (max_vlaue<cross_real[i])  
        {  
            max_vlaue = cross_real[i];  
            max_loc = i;  
        }  
    }  
  
    height_offset = floor(((int)max_loc) / nCol);  
    width_offset = (int)max_loc - nCol*height_offset;  
  
    if (height_offset > 0.5*nRow)  
        height_offset = height_offset - nRow;  
    if (width_offset > 0.5*nCol)  
        width_offset = width_offset - nCol;  
  
    delete[] cross_real;  
    cross_real = NULL;  
}  
int main(int argc, char** argv)
{
	Mat srcImage11 = imread("Brain13x17y.bmp");
	Mat srcImage21 = imread("BrainP.bmp");
	Mat dst1, dst2;
	Mat srcImage1, srcImage2;
	cvtColor(srcImage11, srcImage1, CV_BGR2GRAY);
	cvtColor(srcImage21, srcImage2, CV_BGR2GRAY);


	srcImage1.convertTo(dst1, CV_32FC1);
	srcImage2.convertTo(dst2, CV_32FC1);

	QueryPerformanceFrequency(&freq);
	QueryPerformanceCounter(&startTime);//开始计时
	Point2d phase_shift;
	phase_shift = phaseCorrelate(dst1, dst2);
	cout << "OpneCV库函数实现 :" << endl << "\tX方向的偏移 : " << phase_shift.x << ",\tY方向的偏移 : " << phase_shift.y << endl;
	QueryPerformanceCounter(&stopTime);
	time = 1e3*(stopTime.QuadPart - startTime.QuadPart) / freq.QuadPart;

	cout << "你电脑的频率为:" << freq.QuadPart << endl;
	cout << "opencv库函数消耗时间为:" << time << "毫秒" << endl;
	
	QueryPerformanceCounter(&startTime);//开始计时
	int height_offset = 0;
	int width_offset = 0;
	PhaseCorrelation2D(srcImage1, srcImage2, height_offset, width_offset);//宽的偏移量  
	cout << "Phase Correlation自实现 :" << endl << "高度偏移量" << -height_offset << ",   宽度偏移量" << -width_offset << endl;
	QueryPerformanceCounter(&stopTime);//结束计时
	time = 1e3*(stopTime.QuadPart - startTime.QuadPart) / freq.QuadPart;
	cout << "自实现相位相关函数消耗时间为:" << time << "毫秒" << endl;
	waitKey(0);
	getchar();
	return 0;
}

参考:
数字图像处理-相位相关算法解决图像的刚性平移问题

2.相似性度量总结

Distance Classification
Distance
欧氏距离(Euclidean Distance)
闵可夫斯基距离(Minkowski distance)
曼哈顿距离(Manhattan distance)
切比雪夫距离 ( Chebyshev distance )
标准化欧氏距离(Standardized Euclidean distance )
马氏距离(Mahalanobis Distance)
汉明距离(Hamming distance)
余弦相似度(Cosine Similarity)
杰卡德相似系数(Jaccardsimilarity coefficient)
参考:
相似性度量的各种距离(Distance)计算归类详解及应用

3.支持向量机SVM原理分析

参考:
支持向量机 SVM

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-02-09 20:42:12  更:2022-02-09 20:42:19 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 10:20:29-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码