当前位置 > CPDA数据分析师 > “数”业专攻 > 什么是聚类分析?聚类分析的分类有哪些?

什么是聚类分析?聚类分析的分类有哪些?

来源:数据分析师 CPDA | 时间:2016-12-26 | 作者:admin

在实际问题中,许多领域经常会遇到分类的问题,为什么用聚类分析法呢?什么是聚类分析?聚类分析的分类有哪些?很多问题被抛了出来,今天小编带大家一起探索聚类分析,一顿知识的盛宴哦!

 

聚类分析的意义

聚类分析的目的需要对观测数据进行分析处理,选定一种度量个体接近成都的统计量,再确定分类数目,建立一种分类方法,并按接近程度对观测对象给出合理的分类

 

什么是聚类分析?

聚类分析,又称群分析,即建立一种分类方法:将一批样品或者指标(变量),按照它们在性质上的亲疏、相似程度进行分类。所谓类,即是相似元素的集合。

 

聚类分析

 

聚类分析分类

 

1.按其距勒的方法可以分为一下六种:

 

a.系统聚类分析:开始每个对象自成一类,然后将最相似的两类合并,合并后重新计算新类与其他类的距离或相近性程度。这一过程一直继续下去直到所有的对象归为一类为止。

 

b.调优法:首先对n个对象进行初步分类,然后根据分类的损失函数极可能小的原则对其进行调整,直到分类合理为止。

 

c.最优分割法(有序样品聚类法):开始将所有样品看成一类,然后根据某种最有准则将他们分割为二类、三类,一直分割到所需要的K类为止。这种分类方法适用于有序样品的分类问题,故也称为有序样品聚类。

 

d.模糊聚类法:利用模糊集理论来处理分类问题,他将对经济领域中具有模糊特征的两态数据或多态数据具有明显的分类效果。

 

e.图论据类法:利用图论中最小支撑树的概念来处理问题,创造了独具风格的方法

 

f.聚类预报法:可用来做预报的分析方法很多,如回归分析和判别分析,但对一些异常数据,如气象中的灾难性天气使用回归分析和判别分析效果都不是很好,而聚类弥补了这一不足。

 

2.按分类对象的不同,分为R型和Q型两类

 

a.R型是对变量进行分类。通过R型聚类分析,我们可以了解变量及变量组合之间的亲疏关系:对变量进行分析,也可以根据分类结果及他们之间的关系,在每一类中选择有代表性的变量作为重要变量,利用少数几个重要变量进一步做分析计算

 

b.Q型是对样品进行分类。分类的结果是直观的,期比较传统分类方法更细致,全面,合理。