快速聚类

  · 2010-03-12 11:40 · 15838 次点击

SPSS的快速聚类过程适用于对大样本进行快速聚类，尤其是对形成的类的特征（各变量值范围）有了一定认识时，此聚类方法使用起来更加得心应手。
目录
操作及分析方法
操作及分析方法
为了使粗通统计分析方法的读者也能都使用该过程进行聚类分析，我们先以小样本数据为例说明其操作及分析方法。
例12.3.1对游泳运动员进行分项。为简化问题，仅以10名运动员的三项测试数据为例。其中变量x1=肩宽／髋宽×100；x2=胸厚／胸围×100；x3=腿长／身长×100。预计按姿势分为蝶泳、仰泳、蛙泳、自由泳四类。原始数据如表12-13所示。
表12-13１0名运动员的三项测试数据
data/attachment/portal/201111/06/143006kq995q4scs35z958.jpeg表12-13
操作方法分为以下几步：
（1）首先定义变量、输人数据。建立聚类工作数据文件，也称聚类分析的输入数据文件。
（2）按Analyze、Classify、K-Meanscluster顺序逐一单击鼠标键，最后展开对话框，如图12-20所示。
图12-20K-Meanscluster对话框
data/attachment/portal/201111/06/143009pp8df9ztfp7f8q77.jpeg图12-20K-Meanscluster对话框
（3）指定分析变量和标识变量
本例中标识每个观测量的变量是"no"。因此：
选择主对话框中左面变量表中的"no"。单击鼠标键使之置于光带中。
单击下面一个右箭头按钮，使变量名移到"LableCasesby："下面的矩形框中。
选择参与聚类分析的数值型变量，单击上面一个向右箭头按钮，使选中的变量名移到右面的"Variables："下面的矩形框中。
（4）确定分类数
系统默认的分类数为2，显示在"Numberofcluster"后面的矩形框中。按分析要求应该分为4类，将原数值2改为4。
其他参数全部选用系统默认值，无需继续操作其他按钮或图标按钮。
（5）选择聚类方法
在主对话框中的"Method"框中的两项中可以选择一种聚类方法。我们选择系统默认值。(项前圆圈中有黑点的)所涉及的选择项均使用默认值。
（6）执行Quickcluster命令，方法有两种：
①单击按钮"OK"，系统立即执行该命令。
②单去按钮"Paste"，激活"Syntax"窗，将"Quickcluster"命令及由其子命令和所设置的参数组成的程序生成在该窗中。
根据在主对话框中选择的标识变量、分析变量、和分类数生成以下程序：
QUICKCLUSTER
xlx2x3
／MISSING=LISEWISE
／cRITERIA=cLUSTER(4)MxITER(10)cONVERGE(.02)
／METHOD=KMEANS(NOUPDATE)
／PRINTID（no）INITIAL．
③按该窗中的"Run"按钮，执行窗中的命令程序
（7）显示在输出窗中的程序运行结果如下：
表12-14初始类中心
data/attachment/portal/201111/06/143009fg1m11tkwj9a3oia.jpeg快速聚类
表12-15各次迭代后类中心的变化
data/attachment/portal/201111/06/143010dqzg9ocw90zzgvo7.jpeg快速聚类
表12-16最终的四类的类中心
data/attachment/portal/201111/06/1430102zor92mq5fq79t7c.jpeg快速聚类
表12-17聚类总结
data/attachment/portal/201111/06/143010zdwtur4hda4r313l.jpeg快速聚类

 快速, 聚类

快速聚类

0 条回复

 回复

 今日话题

 最新文章

 热门话题

关于仪器网

仪器信息网

仪器计量技术

服务条款

官方客服