[人工智能] 模糊C均值聚类算法

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 模糊C均值聚类算法 -> 正文阅读

[人工智能]模糊C均值聚类算法

??学习了一下模糊聚类中的模糊 C 均值聚类算法 (Fuzzy C-Means Clustering)。

??Fuzzy 意为模糊，其中包括几种模糊的方式，这里使用的是最简单的方式，它是基于概率的概念。我们把每一个点属于每一类的概率值求出，它属于哪一类别的概率最大，我们就将其归于哪一类。

??这里的 C 其实对应于 K-means 中的 K。其中，K-means 中的 K 决定类别数。同样的，C 也是决定类别数。

??首先我们介绍该算法的目标函数。

??当分类时，我们希望类内距离要越小越好（越集中越好），类与类之间的距离要越大越好。而 Fuzzy C-Means 只用到第一个概念 (类内距离要越小越好)。如果我们同时考虑类与类之间的距离，那么分类效果自然会得到提升。所以还有很多种不同的方式。

??下图中，假设红星是 $c_1$ 的中心，黄星是 $c_2$ 的中心。
?????? 在这里插入图片描述
??我们给每一个点赋予到每一个类别中心的几率值，如下图中， $x_j$ 到 $c_1$ 中心点的几率值为 $u_{1j}$ ，其中 1 表示类别数，j 表示哪一个点。我们将 $u_{1j}$ 称为隶属值 (membership values)，代表点 j 隶属于第一类概率是多少。
?????? 在这里插入图片描述
??那么，也就有点 $j$ 隶属于第2类的概率 $u_{2j}$ 。
??????
??依次类推，如果有 3 类，点 $j$ 就有 3 个隶属值；有 $n$ 类，就有 $n$ 个隶属值。并且需要满足 $u_{1j} + u_{2j} + \dots + u_{nj} = 1$ ，例子中为 $u_{1j} + u_{2j} = 1$ .

??接下来，我们希望点 $j$ 到 $c_1$ 的距离越小越好，到 $c_2$ 的距离越大越好。所以与 K-means 类似，我们需要先算距离。
???? 在这里插入图片描述

??那么，我们给两段距离分别称上相应的几率值。
在这里插入图片描述

??从图中可以看到，几率值上面多了一个 $m$ ，这个 $m$ 就是 Fuzzifier $m$ ，用来控制每一段距离重要性的大小，如图上所示， $u_{1j}$ 应该比较大，比如 0.8， $u_{2j}$ 比较小，如 0.2。

??如果 $u_{2j}^m \| x_j - c_2\| ≈ 0$ ，那么就会忽略 $x_j$ 到 $c_2$ 的距离，只会算 $u_{1j}^m \| x_j - c_1\|$ 。
在这里插入图片描述
??那么扩展到每一个点，就会得到如下式子：
$\sum_{j=1}^N u_{1j}^m\| x_j - c_1\|^2 = u_{1,1}^m\| x_1 - c_1\|^2 + u_{1,2}^m\| x_2 - c_1\|^2 + \dots + u_{1,N}^m\| x_N - c_1\|^2$
????????
??当我们将 membership values 考虑在内时，到 $c_2$ 的 membership values 会很小，最后乘上距离会场趋近于 0，所以，最后问题近似简化成了只考虑红色区块而已，我们希望距离和越小越好。
?????? 在这里插入图片描述

??以此类推，得到：

$\sum_{j=1}^N u_{2j}^m\| x_j - c_2\|^2 = u_{2,1}^m\| x_1 - c_2\|^2 + u_{2,2}^m\| x_2 - c_2\|^2 + \dots + u_{2,N}^m\| x_N - c_2\|^2$

??同样也希望距离和越小越好，那么该栗子的损失函数就是希望 $\sum_{j=1}^N u_{1j}^m\| x_j - c_1\|^2$ 和 $\sum_{j=1}^N u_{2j}^m\| x_j - c_2\|^2$ 越小越好，合为一个式子得到：
$\sum_{i=1}^2 \sum_{j=1}^N u_{ij}^m \| x_j - c_i\|^2 = \sum_{j=1}^N u_{1j}^m \| x_j - c_1\|^2 + \sum_{j=1}^N u_{2j}^m\| x_j - c_2\|^2$

??其中， $c$ 和 $u$ 是未知的。并且满足如下式子：
$\sum_{i=1}^2 u_{i1} = u_{1,1} + u_{2,1} = 1 \\ \dots \\ \sum_{i=1}^2 u_{iN} = u_{1,N} + u_{2,N} = 1$

??将损失函数推广到一般情况为：
$J(u_{ij}, c_i) = \sum_{i=1}^K \sum{j=1}^N u_{ij}^m \| x_j - c_i\|^2$
??其中， $\sum_{i=1}^K u_{ij} = 1, j = 1,2, \dots, N$

??举个例子，假设我们有如下4个点，需要将其分为两类。
???? 在这里插入图片描述
??我们根据距离可能会将 $x_1, x_2$ 分为一类， $x_3, x_4$ 分为一类。

??假设我们知道了第一类的中心为 $c_1$ ，第二类中心为 $c_2$ 。那么我们计算损失为：
?? 在这里插入图片描述

??代入距离为：
?? 在这里插入图片描述
??如上图如式，当我们已知中心点，那么最后损失函数只与 $u$ 相关，我们希望 $J$ 越小越好。

??反过来，当我们知道了 $U$ 值，那么最后 $J$ 只与 $c$ 相关。
???? 在这里插入图片描述

??我们的损失函数中的未知量为 $c$ 和 $U$ ，那么怎么求解以下这种有限制条件的最小值问题，通常的解决方法是使用拉格朗日进行求解。
在这里插入图片描述

??我们的每一个限制条件都需要一个拉格朗日因子。如下图所示，对于点 $x_1$ ，有隶属值 $u_{11}$ 和 $u_{21}$ ，满足条件 $u_{11} + u_{21} = 1$ ，这里的限制条件用一个拉格朗日因子 $\lambda_1$ 表示；同样的对于点点 $x_2$ ，有隶属值 $u_{12}$ 和 $u_{22}$ ，满足条件 $u_{12} + u_{22} = 1$ ，这里的限制条件用一个拉格朗日因子 $\lambda_2$ 表示，依此类推，例子中共有10个点，就有10个限制条件，相应的有10个拉格朗日因子。
在这里插入图片描述
??那么，我们的损失函数变为：
$\mathcal{L}(u_{ij}, c_i, \lambda_j) = \sum_{i=1}^K \sum_{j=1}^N u_{ij}^m \| x_j - c_i\|^2 - \lambda_1 \left(\sum_{i=1}^K u_{i1} - 1\right) - \lambda_2 \left(\sum_{i=1}^K u_{i2} - 1 \right) - \dots - \lambda_N \left(\sum_{i=1}^K u_{iN} - 1 \right)\\ = \sum_{i=1}^K \sum_{j=1}^N u_{ij}^m \| x_j - c_i\|^2 - \sum_{j=1}^N \lambda_j \left(\sum_{i=1}^K u_{ij} - 1 \right)$

??其中 $\sum_{i=1}^K u_{i1} - 1$ 是限制条件 $\sum_{i=1}^K u_{i1} =1$ 移项所得。

??我们将 $\mathcal{L}$ 第一部分展开，可得：
在这里插入图片描述
??现在我们要求 $\mathcal{L}$ 对 $u_{ij}$ 的微分，根据上图展开式发现只有一项包含 $u_{ij}$ ，其余微分时均可看作常量。对于第二项，可以使用相同的方法展开，可得：
????

??那么
$\frac{\partial \mathcal{L}}{\partial u_{ij}} = mu_{ij}^{m-1} \| x_j - c_i\|^2 - \lambda_j = 0 \\ => u_{ij}^{m-1} = \frac{\lambda_j}{m\|x_j - c_i \|^2} \\ = \left(\frac{\lambda_j}{m}\right) \frac{1}{\| x_j - c_i\|^2} \\ => u_{ij} = \left(\frac{\lambda_j}{m}\right)^{\frac{1}{m-1}} \frac{1}{\| x_j - c_i\|^{\frac{2}{m-1}}}$

??但是，式子中仍有 $\lambda_j$ 是未知的，但是我们还有一个限制条件 $\sum_{i=1}^K u_{ij} = 1$ .

??将其代入可以得：
$\sum_{i=1}^K u_{ij} = \sum_{i=1}^K \left(\frac{\lambda_j}{m}\right)^{\frac{1}{m-1}} \frac{1}{\| x_j - c_i\|^{\frac{2}{m-1}}} \\ = \left(\frac{\lambda_j}{m}\right)^{\frac{1}{m-1}} \sum_{i=1}^K \frac{1}{\| x_j - c_i\|^{\frac{2}{m-1}}} = 1 \\ => \left(\frac{\lambda_j}{m}\right)^{\frac{1}{m-1}} = \frac{1}{\sum_{l=1}^K \frac{1}{\| x_j - c_l\|^{\frac{2}{m-1}}}}$

??将得到的 $ (\frac{\lambda_j}{m})^{\frac{1}{m-1}} $ 代入 $u_{ij}$ 可得：
$u_{ij} = \frac{1}{\sum_{l=1}^K \frac{1}{\| x_j - c_l\|^{\frac{2}{m-1}}}} \cdot \frac{1}{\| x_j - c_i\|^{\frac{2}{m-1}}} \\ = \frac{\frac{1}{\| x_j - c_i\|^{\frac{2}{m-1}}}}{\sum_{l=1}^K \frac{1}{\| x_j - c_l\|^{\frac{2}{m-1}}}}$

??现在还是以最开始的栗子为例，现有一点 $x_j$ 到 $c_1$ 的距离为 $x_j - c_1\|^2$ ，到 $c_2$ 的距离为 $x_j - c_2\|^2$ ， $x_j$ 应该属于距离近的一类。
?????? 在这里插入图片描述
??那么怎么表示距离近呢？我们把距离取倒数，距离越近，倒数就越大。
????????
??要满足 $u_{1j} + u_{2j} = 1$ ，类似于数据归一化。我们可以得到：
$u_{1j} = \frac{\frac{1}{\| x_j - c_1\|^2}}{\frac{1}{\| x_j - c_1\|^2} + \frac{1}{\| x_j - c_2\|^2}} \\ u_{2j} = \frac{\frac{1}{\| x_j - c_2\|^2}}{\frac{1}{\| x_j - c_1\|^2} + \frac{1}{\| x_j - c_2\|^2}}$

??以上就是 $\mathcal{L}$ 对 $u_{ij}$ 微分的推导过程。那么 $\mathcal{L}$ 对 $c_i$ 微分类似。
$\frac{\partial \mathcal{L}}{\partial c_i} = \sum_{j=1}^N u_{ij}^m \cdot 2 \cdot ( x_j - c_i) \cdot (-1) \\ = \sum_{j=1}^N (-2) \cdot u_{ij}^m (x_j - c_i) = 0 \\ => \sum_{j=1}^N u_{ij}^m x_j - \left(\sum_{j=1}^N u_{ij}^m \right)c_i = 0 \\ => c_i = \frac{\sum_{j=1}^N u_{ij}^m x_j}{\sum_{j=1}^N u_{ij}^m}$

那么该算法的流程大致如下;

Initialize the membership values $u_{ij}$ .
At $t$ -step: calculate the centers by
$c_i = \frac{\sum_{j=1}^N u_{ij}^m x_j}{\sum_{j=1}^N u_{ij}^m}$
Update $u_{ij}$ by
$u_{ij} = \frac{\frac{1}{\| x_j - c_i\|^{\frac{2}{m-1}}}}{\sum_{l=1}^K \frac{1}{\| x_j - c_l\|^{\frac{2}{m-1}}}}$
Compute the value of the objective function $J^{(t)}$ ,
$J^{(t)} = \sum_{i=1}^K \sum_{j=1}^N u_{ij}^m \| x_j - c_i\|^2$
If $|J^{(t)} - J^{(t-1)} | < \epsilon$ , then stop; otherwise return to step 2.

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2021-08-28 09:00:22 更:2021-08-28 09:22:24

360图书馆购物三丰科技阅读网日历万年历 2026年2日历

-2026/2/21 22:07:03-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码