当前位置 > CPDA数据分析师 > “数”业专攻 > 什么是判别分析?判别分析的思想是什么?

什么是判别分析?判别分析的思想是什么?

来源:数据分析师 CPDA | 时间:2016-12-27 | 作者:admin

判别分析是判别样品所属类型的一种分析方法,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。例如,在医学诊断中,一个病人肺部有阴影,医生要判断他换的肺结核、肺部良性肿瘤还是肺癌。在这里,由肺结核病人、良性肿瘤病人,肺癌病人三类总体构成病人群体,病人属于这个三个总体之一,通过测得病人的指标(阴影的大小、边缘是否光滑,体温是多少...),利用判别分析就可以判断他是属于哪一个总体的。

 

其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。从而确定某一样本属于何类。

 

判别分析方法

 

判别分析分类

1.根据判别中的组数分为:两组判别分析和多组判别分析;

2.根据判别函数的形式分为:线性判别和非线性判别;

3.根据判别式处理变量的方法不同分为:逐步判别、序贯判别等;

4.根据判别标准不同分为:距离判别、Bayes判别、Fisher判别等

基于以上4种分类方法,我们下面介绍3种常用的判别分析思想

1>距离判别

基本思想:距离判别也称为直观判别,式计算样品到第i类总体平均的距离,哪个距离最小就将他判归哪个总体。因此。我们首先考率是否能构造一个恰当的距离函数,通过样本与某类别之间距离的大小,判别其所属类别。

 

2>Bayes判别

基本思想:假设对研究对象的总体已有一定的认知,常用先验概率分布来描述这种认知,然后抽取一个样本,用样本来修正已有的认知(先验概率的分布),得到后验概率分布。各种统计判断都是通过后验概率分布来进行。

 

3>Fisher判别

基本思想:就是投影,针对P维空间中的某点寻找一个能使他降为一维数值的线性函数。