IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> C++知识库 -> 基于GDAL用C++实现K-means算法 -> 正文阅读

[C++知识库]基于GDAL用C++实现K-means算法

前言

本人使用C++语言,和GDAL库来实现K-means算法

一、代码解释

1、K-means算法解释

K-means聚类方法,又称K均值聚类,主要是将需要聚类的对象分为K类(K个簇)。

2、算法原理

首先,选出K个聚类中心(亦称为K个簇中心),然后将每一个待分类的对象分到离其最近的聚类中心所在的类中,然后重新更新每一个聚类(簇)的中心,反复迭代计算,直至满足没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,或者达到最大的迭代次数为止。

3、算法具体解释

1、在K-means算法中,其最初聚类中心的选择会影响迭代次数以及最后的聚类效果,本次实验选取初始聚类中心的方法如下:
首先随机在聚类对象选出一个初始聚类中心,记为A,再在剩余的聚类对象中选出离A最远的对象为第二个聚类中心,记为B,然后在在剩余的聚类对象中,选出与已有的聚类中心(A,B)中的最小距离最大者,作为新的聚类中心,依次类推,选出与已有的中心最小距离最大者,作为新的聚类中心,直至聚类中心个数满足要求为止。
2、迭代停止条件,由于本次实验算法为有迭代思想,需定义实验终止条件。本次实验终止条件为:没有聚类中心再发生变化。
3、代码提示:
#创建 k 个点作为起始质心(1、中的方法创建)
#while(不满足跳出迭代的条件)
{
for(对每一个对象)
{
#找出离其最近的聚类中心,并更新对象的所属属性,与之前的所属属性对比
}
#更新聚类中心(簇中心),并算出与前一次相比的中心变化
}
#对象的输出,并显示

在这里插入图片描述

二、算法实现

代码如下:

#include <stdio.h>
#include "gdal_priv.h"
#include "ogrsf_frmts.h"
#include <math.h>
#include <algorithm> 
#include<iostream>
#include<vector>

using namespace std;
struct Centor
{
	double x;
	double y;
};
//返回两点距离
double getDistance(double x1, double y1, double x2, double y2)
{
	return ((x1 - x2)*(x1 - x2) + (y1 - y2)*(y1 - y2));
}
//返回一个随机数
static int random()
{
	srand((unsigned)time(NULL));
	int n, m;
	n = 799;
	m = 0;
	int num = rand() % (n - m + 1) + m;
	return num;
}
//打开文件
OGRLayer* Open(string strFilePath)
{
	//GDAL注册
	GDALAllRegister();
	解决中文乱码问题
	CPLSetConfigOption("GDAL_FILENAME_IS_UTF8", "NO");
	//声明数据集指针
	GDALDataset* poSrcShp;
	//此处填入所需打开矢量文件路径
	//数据集指针初始化
	poSrcShp = (GDALDataset *)GDALOpenEx(strFilePath.c_str(), GA_Update, NULL, NULL, NULL);
	if (poSrcShp == NULL)
	{
		std::cout << "数据打开失败!" << std::endl;
		return NULL;
	}
	//读取矢量数据,shp数据默认图层数为1
	OGRLayer  *poLayer;
	poLayer = poSrcShp->GetLayer(0);

	return poLayer;
}
//返回选择的簇心
void getPoints(string strFilePath, vector<int>& point)
{
	//获取图层

	OGRLayer* poLayer = Open(strFilePath);
	OGRFeature *poFeature = poLayer->GetFeature(0);
	//对图层进行初始化
	poLayer->ResetReading();
	//簇心个数
	cout << "请输入选择簇心点数" << endl;
	int num;
	cin >> num;
	//初始化第一个参数
	int q = random();
	point.push_back(q);
	double distance = 0;
	int num2 = point.size();
	double maxDistance = 0;
	int Fid = 0;
	int nFeatureCount = poLayer->GetFeatureCount();
	for (int n=1 ; n < num; n++)
	{
		maxDistance = -1;
		for (int i = 0; i < nFeatureCount; i++)
		{
			double dMin = 9999999999999999999;
			OGRFeature* poOtherPoint = poLayer->GetFeature(i);
			double x2 = poOtherPoint->GetFieldAsDouble(1);
			double y2 = poOtherPoint->GetFieldAsDouble(2);
			//选出和已有簇中心最小的距离
			for (int m =0;m< num2;m++)
			{
				//获取当前簇心的x,y坐标
				OGRFeature * poTempPoint = poLayer->GetFeature(point[m]);
				double x3 = poTempPoint->GetFieldAsDouble(1);
				double y3 = poTempPoint->GetFieldAsDouble(2);
				//计算与选取簇心的距离
				distance = getDistance(x2, y2, x3, y3);
				if (distance<dMin)
				{
					dMin = distance;
				}
				
			}
			//与当前最大值比较并计录Fid
			//计录上一个点的distance
			if (dMin > maxDistance)
			{
				Fid = i;
				maxDistance = dMin;//更新最大值
			}
		}
		point.push_back(Fid);
		num2++;
	}
}
//重置簇心
void reset(OGRLayer*poLayer, vector<Centor>&centorList, vector<int>&point )
{
	int nFeatureCount = poLayer->GetFeatureCount();
	OGRFeature* poFeature = NULL;
	Centor resetCentor;
	for (int n = 0; n < point.size(); n++)
	{
		double sumX = 0, sumY = 0;
		int num = 0;
		for (int m = 0; m < nFeatureCount; m++)
		{
			poFeature = poLayer->GetFeature(m);
			int  from = poFeature->GetFieldAsInteger("from");
			if (from == point[n])
			{
				sumX += poFeature->GetFieldAsDouble(1);
				sumY += poFeature->GetFieldAsDouble(2);
				num++;
			}
		}
		sumX = sumX / double(num);
		sumY = sumY / double(num);
		resetCentor.x = sumX;
		resetCentor.y = sumY;
		centorList[n] = resetCentor;
	}
}
//判断簇心是否变化
bool equal(vector<Centor>&centorList,vector<Centor>&centorList2)
{
	int n = centorList.size();
	if (centorList.empty() || centorList2.empty())
	{
		return 0;
	}
	for (int i = 0; i < n; i++)
	{
		if (centorList[i].x != centorList2[i].x || centorList[i].y != centorList2[i].y)
		{
			return 0;
		}
	}
	return 1;
}
//创建新的的shp文件,用于聚类算法
void createShp(string strFilePath,string outPutPath)
{
	//复制创建数据集
	CPLSetConfigOption("GDAL_FILENAME_IS_UTF8", "NO");
	const char *pszDriverName = "ESRI Shapefile";
	GDALDriver *poDriver = OGRSFDriverRegistrar::GetRegistrar()->GetDriverByName(pszDriverName);
	//打开源数据集
	const char* datasetPath = strFilePath.c_str();
	GDALDataset*poSrcData = (GDALDataset *)GDALOpenEx(datasetPath,GA_Update, NULL, NULL, NULL);
	//拷贝新数据集
	GDALDataset *poDstData = poDriver->CreateCopy(outPutPath.c_str(),poSrcData, 0, 0, 0, NULL);
	OGRLayer*poLayer = poDstData->GetLayer(0);
	//添加字段 “from——类别”
	OGRFieldDefn ofrom("from", OFTInteger);
	ofrom.SetWidth(6);
	poLayer->CreateField(&ofrom);
	GDALClose(poDstData);
}
//K-means聚类
void kMeans(string strFilePath,vector<int>&point)
{
	cout << "请输入输出shp文件路径" << endl;
	cout << "最后在shp文件尾加上簇心点数" << endl;
	string outPutPath;
	cin >> outPutPath;
	createShp(strFilePath,outPutPath);
	//先插入该点目前簇心xy值
	int n = point.size();
	Centor resetCentor;
	vector<Centor>centorList;
	vector<Centor>currentCentorList;
	OGRLayer*poLayer = Open(outPutPath);
	for (int i = 0; i < n; i++)
	{
		resetCentor.x = poLayer->GetFeature(point[i])->GetFieldAsDouble(1);
		resetCentor.y = poLayer->GetFeature(point[i])->GetFieldAsDouble(2);
		centorList.push_back(resetCentor);
	}
	//迭代更新点类别,更新簇心
	//循环条件为簇心位置不再变化
	int nFeatureCount = poLayer->GetFeatureCount();
	int Fid = 0;
	while (!equal(centorList,currentCentorList))
	{
		for (int i = 0; i < nFeatureCount; i++)
		{
			double d_Min = 9999999999999999999;
			OGRFeature *poFeature = poLayer->GetFeature(i);
			//选出最小的距离,选择簇类中心
			for (int j = 0; j < n; j++)
			{
				double x1 = poFeature->GetFieldAsDouble(1);
				double y1 = poFeature->GetFieldAsDouble(2);
				double x2 = centorList[j].x;
				double y2 = centorList[j].y;
				double ddistance = getDistance(x1, y1, x2, y2);
				if (d_Min > ddistance)
				{
					d_Min = ddistance;
					Fid = point[j];
				}
			}
			//此时point即为类别
			poFeature->SetField("from", Fid);
			poLayer->SetFeature(poFeature);
		}
		currentCentorList = centorList;
		reset(poLayer, centorList, point);
	}
}

void main()
{
	cout << "请输入原始shp文件路径" << endl;
	string strFilePath;
	cin >> strFilePath;
	//创建输出shp文件
	//返回簇心s
	vector<int>point;
	getPoints(strFilePath,point);
	kMeans(strFilePath,point);

}


总结

本代码需要输入初始shp文件、选择簇心点个数和结果shp文件地址。操作如图:
在这里插入图片描述
用arcmap读取数据并符号化表示:
此为三个簇心选择结果
在这里插入图片描述

5个簇心选择结果
在这里插入图片描述
8个簇心选择结果
在这里插入图片描述

  C++知识库 最新文章
【C++】友元、嵌套类、异常、RTTI、类型转换
通讯录的思路与实现(C语言)
C++PrimerPlus 第七章 函数-C++的编程模块(
Problem C: 算法9-9~9-12:平衡二叉树的基本
MSVC C++ UTF-8编程
C++进阶 多态原理
简单string类c++实现
我的年度总结
【C语言】以深厚地基筑伟岸高楼-基础篇(六
c语言常见错误合集
上一篇文章      下一篇文章      查看所有文章
加:2021-07-25 11:28:13  更:2021-07-25 11:28:49 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/28 11:45:10-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码