什么是置信区间(置信水平Confidence level)?其与样本量的关系
Baike · 2012-02-22 22:12 · 76136 次点击
什么是置信区间(置信水平Confidencelevel)?其与样本量的关系
置信区间(置信水平Confidencelevel)是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。
一、置信区间的概念
置信区间又称估计区间,是用来估计参数的取值范围的。常见的52%-64%,或8-12,就是置信区间(估计区间)。置信区间是按下列三步计算出来的:
第一步:求一个样本的均值
第二步:计算出抽样误差。
人们经过实践,通常认为调查:
100个样本的抽样误差为±10%
500个样本的抽样误差为±5%
1,200个样本时的抽样误差为±3%
第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。
举例说明:
美国Gallup(盖洛普)公司就消费者对美国产品质量的看法,对美国、德国和日本三国共计3,500名消费者(每个国家约1,200名)分别进行了调查,调查结果:有55%的美国人认为美国产品质量好,而只有26%的德国人和17%的日本人持同样看法。抽样误差为±3%,置信水平为95%。则这三个国家消费者的置信区间分别为:
国别样本均值抽样误差置信区间
美国55%±3%52%-58%
德国26%±3%23%-29%
日本17%±3%14%-20%
二、关于置信区间的宽窄
窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。
假设全班考试的平均分数为65分,则
置信区间间隔宽窄度表达的意思
0-100分100宽等于什么也没告诉你
30-80分50较窄你能估出大概的平均分了(55分)
60-70分10窄你几乎能判定全班的平均分了(65分)
三、样本量对置信区间的影响
影响:在置信水平固定的情况下,样本量越多,置信区间越窄。
下面是经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同):
样本量置信区间间隔宽窄度
10050%—70%20宽
80056.2%-63.2%7较窄
1,60057.5%—63%5.5较窄
3,20058.5%—62%3.5更窄
由上表得出:
1、在置信水平相同的情况下,样本量越多,置信区间越窄。
2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一倍(实践证明,样本量要增加4倍,置信区间才能变窄一倍),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。
通过置信区间的计算公式来验证置信区间与样本量的关系
置信区间=样本的推断值±(可靠程度系数×)
从上述公式中可以看出:
在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。
四、置信水平对置信区间的影响
影响:在样本量相同的情况下,置信水平越高,置信区间越宽。
举例说明:美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±2.3%,置信水平降到为90%。则两组数字的情况比较如下:
抽样误差置信水平置信区间间隔宽窄度
±3%95%60%±3%=57%-63%6宽
±2.3%90%60%±2.3%=57.7%-62.3%4.6窄
由上表得出:
在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。
五、样本量对置信水平的影响
影响:在置信区间不变的情况下,样本量越多,置信水平越高。
举例说明:
置信区间样本量置信水平
52%-58%1,20095%(前面美国盖洛普公司的例子)
置信区间(置信水平Confidencelevel)公式:
Pr(c1<=μ<=c2)=1-α
α是显著性水平(例:0.05或0.10)
100%*(1-α)指置信水平(例:95%或90%)
表达方式:interval(c1,c2)——置信区间