假性相关
Baike · 2010-03-12 18:09 · 39276 次点击
目录
概念
发展
概念
在统计学中相关性与因果关系的研究中,误把相关视为因果效应关系,因为样本相关系数非常大,并不意谓二个变量之间具有因果关系。若所观察的两个变量依同一个方向变动,并不隐含它们之间存有直接关系。尽管x与y可能没有相关或有负的相关,但此亦可能由于第三个变量的变动,而引起x与y依相同的方向变动。实际上引发x与y具有相关的第三个变量;称为潜伏变量(lurkingvariable),而此种错误相关的现象,称为假性相关(spuriouscorrelation)。
发展
自从19世纪末科学心理学兴起以来,心理学即仿照自然科学,采取了“根据观察到的现象探求现象背后的真相”的研究取向。由于现象背后的真相无法直接观察测量,故而改采统计学上相关的原理来推论解释。惟经统计处理后发现两个(或多个)变项之间具有相关关系时,却无法肯定变项间究竟是否存在因果关系。此即西蒙1954年提出的假相关与因果性的问题。所谓假相关(spuriouscorrelation),是指两变项之间的相关是表面的,不代表两变项间具有真的因果性(causality)(因生果或互为因果)。他举例说明假相关可能在两种情形下产生:(1)两变项间本无关系,只因第三变项存在而造成两变项的假相关。例如小学生的平均身高虽与其平均书写词汇间有相关关系。事实上两者间彼此无关,造成其相关的是第三个变项(年龄或年级)。(2)两变项之间的相关不是直接的,而是由于两变项间所存在的第三个中介变项使然。例如某公司调查发现已婚员工平均子女数与其定期内平均请假缺席时数具有正相关关系。按西蒙的解释,此种情形不是假相关,而是间接相关。原因是构成员工缺席的原因与他们子女多需要照顾有关。在心理学上通常采用净相关(partialcorrelation)统计方法剔除假相关因素,从而了解变项之间的相关关系。