通过聚类分析可将样本划分为若干类别,判断分类合理性的一个常用方法是采用均值检验(means方法),分析各类别在各变量上的均值差异。若统计结果显示不同类别间的差异显著,则说明聚类结果具有较好的区分度和可靠性,能够真实反映数据内在结构特征。
1、 假设已获得聚类分析结果,所有样本均已完成分类。此时在数据窗口中已生成多个新变量,用于呈现各样本的分类归属。所示,界面上展示了三种聚类方案,分别将数据划分为三类、四类和五类,直观反映出不同类别划分下的聚类效果。
2、 在菜单栏中选择分析—比较均值—均值,即可打开均值分析对话框。
3、 将所有指标变量选入因变量框,并把聚类分析得出的分组变量也放入其中。
4、 点击确认,启动数据运行并展示结果。
5、 将案例分别划分为5类、4类和3类后,可得到三组分类结果的平均值,具体数据所示。该方法仅能计算各类别的平均情况,若需进一步检验各均值间是否存在显著差异,则需采用后续所述的统计分析方法。
6、 在菜单栏中依次选择分析、比较均值,然后点击单因素ANOVA进行操作。
7、 把指标变量选入因变量列表,分组变量放入因子框,点击确定即可开始数据分析。
