快速聚类
· 2010-03-12 11:40 · 11550 次点击
SPSS的快速聚类过程适用于对大样本进行快速聚类,尤其是对形成的类的特征(各变量值范围)有了一定认识时,此聚类方法使用起来更加得心应手。
目录
操作及分析方法
操作及分析方法
为了使粗通统计分析方法的读者也能都使用该过程进行聚类分析,我们先以小样本数据为例说明其操作及分析方法。
例12.3.1对游泳运动员进行分项。为简化问题,仅以10名运动员的三项测试数据为例。其中变量x1=肩宽/髋宽×100;x2=胸厚/胸围×100;x3=腿长/身长×100。预计按姿势分为蝶泳、仰泳、蛙泳、自由泳四类。原始数据如表12-13所示。
表12-1310名运动员的三项测试数据
data/attachment/portal/201111/06/143006kq995q4scs35z958.jpeg表12-13
操作方法分为以下几步:
(1)首先定义变量、输人数据。建立聚类工作数据文件,也称聚类分析的输入数据文件。
(2)按Analyze、Classify、K-Meanscluster顺序逐一单击鼠标键,最后展开对话框,如图12-20所示。
图12-20K-Meanscluster对话框
data/attachment/portal/201111/06/143009pp8df9ztfp7f8q77.jpeg图12-20K-Meanscluster对话框
(3)指定分析变量和标识变量
本例中标识每个观测量的变量是"no"。因此:
选择主对话框中左面变量表中的"no"。单击鼠标键使之置于光带中。
单击下面一个右箭头按钮,使变量名移到"LableCasesby:"下面的矩形框中。
选择参与聚类分析的数值型变量,单击上面一个向右箭头按钮,使选中的变量名移到右面的"Variables:"下面的矩形框中。
(4)确定分类数
系统默认的分类数为2,显示在"Numberofcluster"后面的矩形框中。按分析要求应该分为4类,将原数值2改为4。
其他参数全部选用系统默认值,无需继续操作其他按钮或图标按钮。
(5)选择聚类方法
在主对话框中的"Method"框中的两项中可以选择一种聚类方法。我们选择系统默认值。(项前圆圈中有黑点的)所涉及的选择项均使用默认值。
(6)执行Quickcluster命令,方法有两种:
①单击按钮"OK",系统立即执行该命令。
②单去按钮"Paste",激活"Syntax"窗,将"Quickcluster"命令及由其子命令和所设置的参数组成的程序生成在该窗中。
根据在主对话框中选择的标识变量、分析变量、和分类数生成以下程序:
QUICKCLUSTER
xlx2x3
/MISSING=LISEWISE
/cRITERIA=cLUSTER(4)MxITER(10)cONVERGE(.02)
/METHOD=KMEANS(NOUPDATE)
/PRINTID(no)INITIAL.
③按该窗中的"Run"按钮,执行窗中的命令程序
(7)显示在输出窗中的程序运行结果如下:
表12-14初始类中心
data/attachment/portal/201111/06/143009fg1m11tkwj9a3oia.jpeg快速聚类
表12-15各次迭代后类中心的变化
data/attachment/portal/201111/06/143010dqzg9ocw90zzgvo7.jpeg快速聚类
表12-16最终的四类的类中心
data/attachment/portal/201111/06/1430102zor92mq5fq79t7c.jpeg快速聚类
表12-17聚类总结
data/attachment/portal/201111/06/143010zdwtur4hda4r313l.jpeg快速聚类