IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> KNN(K近邻)和K-means(聚类)的区别 -> 正文阅读

[人工智能]KNN(K近邻)和K-means(聚类)的区别

一、前言

嗐,知识学多都学杂了,最近总是搞混这两个算法。今天终于有时间来整理一下。

二、算法简介

KNN(K-Nearest Neighbor)是机器学习中的分类算法,它将距离相近的样本点分为同一类,KNN 中的K指的是近邻个数,也就是最近的K个点,根据它距离最近的K个点的类别来判断属于哪个类别。KNN是有标签的

人以群分,物语类聚;近朱者赤,近墨者黑 是 KNN 的核心思想。这其实和我们在日常生活中评价一个人是一样的,如果你想要知道一个人是什么样的,那就去找和他关系好的几个人看看对他的评价or看和他关系好的人是什么样子的,就可以大致判断出他是什么样的人了。

而K-means聚类当属无监督聚类算法中最经典的算法 。该算法的主要作用是将相似的样本自动归到一个类别中

三、算法思想

话不多说,直接上算法思想

KNN的算法思想:

  1. 计算测试数据与各个样本数据之间的距离,通常为欧式距离;
  2. 按照距离的递增关系进行排序;
  3. 选取距离最小的K个点;(即最近的K个点)
  4. 确定前K个点所在类别的出现频率;
  5. 返回前K个点中出现频率最高的类别作为测试数据的预测分类。

优点:简单,易于理解,易于实现,无需估计参数。对数据没有假设,准确度高,对异常点不敏感。
缺点:计算量太大,尤其是特征数非常多的时候。每一个待分类文本都要计算它到全体已知样本的距离,才能得到它的第K个最近邻点。
样本不平衡的时候,对稀有类别的预测准确率低。当样本不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个新样本时,该样本的K个邻居中大容量类的样本占多数。

K-means算法思想:

  1. 随机选取k个点,作为聚类中心。
  2. 计算每个点分别到k个聚类中心的距离,然后将该点分到最近的聚类中心,这样就形成了k个簇。
  3. 再重新计算每个簇的中心。
  4. 重复以上2-3步,直到质心位置不在变化,或者达到设定的迭代次数。

如何选取K值:根据经验以及利用k-means聚类的目的来决定。最好选择数据中的点。
优点:广泛应用,速度快,鲁棒性强
缺点:刚开始的k值很难估计,进行k-means时,要给出聚类数量,但是并不知道要给出多少,希望算法可以给出一个合理的数量。刚开始的k值时随机给的,结果也有很大的随机性。数据量大时,算法的时间开销也是很大

四、小结

今天就写到这里啦,后边日常遇到了其他算法会继续记录的奥,欢迎评论与收藏~

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-12-25 11:10:20  更:2022-12-25 11:14:22 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/4 21:29:08-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码