数量资料统计描述
仪器信息网 · 2011-04-14 23:15 · 37807 次点击
对数值变量资料进行统计分析的一般步骤,是先对观察测量得到的变量值(即观察值)进行统计描述,再在此基础上进行深入的统计推断。统计描述的工作主要是在编制频数表的基础上描述资料的集中位置和离散程度。
一、数值变量资料的频数表
1.频数表(frequencytable)的编制方法:
(1)找出观察值中的最大值(largestvalue)、最小值(smallestvalue)和极差(range)。
(2)据极差大小确定组段和组距(classinterval),将其分为10个左右的组段。
(3)列表划记落在各组段内的观察值个数即可得频数表。
根据编制出的频数表即可了解该数值变量资料的频数分布特征。
2.频数分布的特征及类型:
(1)两个特征:集中趋势(centraltendency)和离散趋势(tendencyofdispersion)
(2)两种类型:对称分布(symmetricdistribution)和偏态分布(skeweddistribution),偏态分布又有正偏态(positivelyskewed)和负偏态(negativelyskewed)之分。
3.频数表的用途:
(1)描述资料的分布特征和分布类型。
(2)进一步计算有关指标或进行统计分析。
(3)发现特大、特小的可疑值。
(4)据此绘制频数分布图。
二、集中位置的描述
描述一组观察值集中位置或平均水平的指标称为平均数(average)。它能使人对资料有个简明概括的印象,并能进行资料间的比较。常用的平均数有算术均数、几何均数和中位数。
1.算术均数(arithmeticmean)
简称均数(mean),有总体均数和样本均数之分,分别用希腊字母miu(音)和英文字母xbar(音)表示。
(1)计算方法
不分组资料用直接法。即所有观察值的累积和除以观察值个数,相同观察值较多或分组资料常用加权法(weightingmethod)。