模糊c均值聚类

FCM算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间 相像度最大,而不同簇之间的相像度最小。模糊C均值算法是一般C均值算法的改进,一 般C均值算法对于数据的划分是硬性的,而FC

算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间 相 FCM 像度最大,而不同簇之间的相像度最小。模糊均值算法是一般均值算法的改进,一 般均 CCC 值算法对于数据的划分是硬性的,而则是一种柔性的模糊划分。在介绍详细算法之前 FCMFCM 我们先介绍一些模糊集合的基本学问。 6.1.1 模糊集基本学问卬] 首先说明隶属度函数的概念。隶属度函数是表示一个对象隶属于集合的程度的函 数, xA Ua(x), 通常记做其自变量范围是全部可能属于集合的对象(即集合所在空间中 的全部点), AA 取值范围是』],即二 [00< (( 二表示完全隶属于集合相当于传统集合概念上的。一个定义 在空 UAx)<=lo uAx)lxA,x£ A 间上的隶属度函数就定义了一个模糊集合或者叫定义在论域上的模糊 X={x}A,X={x} …… , X], X2,Xn 子集。对于有限个对象模糊集合可以表示为: AA A= {(jLi(x),x)\xX} e(6.1) Aiii 〜 有了模糊集合的概念,一个元素隶属于模糊集合就不是硬性的了,在聚类的问题中,可 以 把聚类生成的簇看成模糊集合,因此,每个样本点隶属于簇的隶属度就是区间里面 的值。 [0, 1] 6.1.2 K(HCM) 均值聚类算法介绍 均值聚类,即众所周知的均值聚类,已经应用到各种领域。它的核心思想如下: 算 KC ・ 法把个向量七(分为个组并求每组的聚类中心,使得非相像性 (或距 n1,2…,n)cGi(i=l,2,..,c), 离)指标的价值函数(或目标函数)达到最小。当选择欧几里德距离为组中向量与相应聚类 jXk 中心间的非相像性指标时,价值函数可定义为: Ci 2 -Ci ||) , /= —— =( 2^11^ (6.2) i=\ k,xeGi z=l k 这里力是组内的价值函数。这样的值依靠于的几何特性和 =f(c,F)iJiGiCi k,xeGi /=1 k 的位置。 , 一般来说,可用一个通用距离函数代替组中的向量则相应的总价值函数可 d(Xk,Ci)IXk 表示为: J= pji =£( ))( Zd@—G6.3) i=l k,xeGi z=l k 为简洁起见,这里用欧几里德距离作为向量的非相像性指标,且总的价值函数表示为 (6.2) 式。 划分过的组一般用一个的二维隶属矩阵来定义。假如第个数据点不属于组则 cXnUji, U : Ujj ;( 中的元素因为否则,该元素取。一旦确定聚类中心可导出如下使式最小 10ci,6.2) Xj kw i,j 对每个如果卜一生『< 1 (6.4) %= < 其它 0 V

腾讯文库模糊c均值聚类