IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 动态聚类法 -> 正文阅读

[人工智能]动态聚类法

动态聚类法

在这里插入图片描述
两种常用算法:

  • K-均值算法(K-means算法)
  • 迭代自组织的数据分析算法(ISODATA, iterative self-organizing data analysis techniques algorithm)

?

一、K—均值算法(K-means)

1.1 条件及约定

  • 待分类的模式特征矢量集为 { x1,x2,…,xN };
  • 类的数目K是事先取定的。

1.2 基本思想:

  • 首先任意选取K个聚类中心
  • 最小距离原则将各模式分配到K类的某一类;
  • 不断计算聚类中心调整各模式的类别
  • 最终使各模式到其判属类别中心的距离平方之和最小

1.3 基于使聚类准则函数最小化

准则函数

  • 聚类集中每一样本点到该类中心距离平方和

对于第 j 个聚类集,准则函数定义为
在这里插入图片描述

  • Sj:第j个聚类集(域)
  • 聚类中心Zj
  • Nj:第j个聚类集Sj中所包含的样本个数

?
?
所有K个模式类有:
在这里插入图片描述

?
?

聚类准则

K-均值算法的聚类准则:

  • 聚类中心的选择应使准则函数J极小
    • 即使Jj的值极小

?
对于某一个聚类 j:
在这里插入图片描述
即 :
在这里插入图片描述
可解得 :
在这里插入图片描述


1.4 算法步骤

(1) 任选K个模式特征矢量作为初始聚类中心

  • z1(1) ,z2(1) ,…zK(1)。
  • 括号内的序号表示迭代次数

(2) 将待分类的模式特征矢量集{x}中的模式

  • 逐个按最小距离原则分划给K类中的某一类。
  • 如果 D j ( k ) = min ? { ∥ x ? Z i ( k ) ∥ } , i = 1 , 2 , … , K \mathrm{D}_{j}(k)=\min \left\{\left\|x-\mathrm{Z}_{i}(k)\right\|\right\}, \quad i=1,2, \ldots, K Dj?(k)=min{x?Zi?(k)},i=1,2,,K
    则判 x ∈ S j ( k ) x \in S_{j}(k) xSj?(k)

(3) 计算重新分类后的各聚类中心 z j ( k + 1 ) z_{j}(k+1) zj?(k+1)

  • 即 求各聚类域中所包含样本的均值向量
    在这里插入图片描述
  • 均值向量新的聚类中心
    • 可得新的准则函数:
      在这里插入图片描述

(4) 如果 z j ( k + 1 ) = z j ( k ) ( j = 1 , 2 , … K ) z_{j}(k+1)=z_{j}(k)(j=1,2, \ldots K) zj?(k+1)=zj?(k)(j=1,2,K),则结束;

  • 否则,k=k+1, 转(2)

?

1.5 讨 论

  • “动态”聚类法?

    • 聚类过程中,
      聚类中心位置或个数发生变化。
      ?
  • 算法讨论
    结果受到:
    1. 所选聚类中心的个数和其初始位置
    2. 以及模式样本的几何性质读入次序等的影响

    实际应用中需要试探不同的K值和选择不同的聚类中心起始值


?

1.6 例题

例2.3:已知20个模式样本如下,试用K-均值算法分类。
在这里插入图片描述

解:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
结果图示:
在这里插入图片描述
?


?
?

1.7 类别数目未知情况下如何使用?

  • 在类别数未知情况下使用K—均值算法时:
    • 可以假设类别数是逐步增加的。
    • 显然准则函数是随K的增加而单调地减少的。

?

  • 如果样本集的合理聚类数为K类
    • 类别数从1增加到K准则函数迅速减小
    • 当类别数超过K时,准则函数虽然继续减少但会呈现平缓趋势

在这里插入图片描述

1.8 如何避免初始聚类中心的影响?

  • 多次运行K均值算法

    例如50~1000次,每次随机选取不同的初始聚类中心

  • 聚类结束后计算准则函数值

  • 选取准则函数值最小的聚类结果为最后的结果。

  • 该方法一般适用于聚类数目小于10的情况。

?


?
?

二、ISODATA算法

2.1 ISODATA算法的提出

(iterative self-organizing data analysis techniques algorithm,ISODATA)

  • K—均值算法比较简单,但它的自我调整能力也比较差。
    • 这主要表现在类别数不能改变
    • 受代表点初始选择的影响也比较大。

ISODATA算法的功能与K—均值算法相比,在下列几方面有改进:

  1. 可以改变类别数目
    通过类别的合并与分裂来实现。

  2. 合并
    · 主要发生在某一类内样本个数太少的情况
    · 或两类聚类中心之间距离太小的情况。
    · 为此设有最小类内样本数限制,以及类间中心距离参数

  3. 分裂
    · 主要发生在某一类别的某分量出现类内方差过大的现象
    · 因而宜分裂成两个类别,以维持合理的类内方差
    · 给出一个对类内分量方差的限制参数,用以决定是否需要将某一类分裂成两类。

  4. 由于算法有自我调整的能力
    · 因而需要设置若干个控制用参数
    · 如:
    聚类数期望值K
    每次迭代允许合并的最大聚类对数L
    允许迭代次数I


?

2.2 ISODATA算法

2.2.1基本步骤和思路

  • (1) 选择初始控制参数
    可选不同的指标,也可在迭代过程中人为修改,
    以将N个模式样本按指标分配到各个聚类中心中去。

  • (2) 计算各类中诸样本距离指标函数

  • (3)~(5)按给定的要求,将前一次获得的聚类集进行分裂和合并处理
    【(4)为分裂处理,(5)为合并处理 】
    从而获得新的聚类中心

  • (6) 重新进行迭代运算
    计算各项指标
    判断聚类结果是否符合要求,如不符合,返回(2)。
    经过多次迭代后,若结果收敛,则运算结束

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-28 12:23:44  更:2021-10-28 12:24:07 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 8:33:56-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码