随机扰动项

  ·  2010-03-11 21:39  ·  35173 次点击
随机扰动项我习惯称之为随机误差项,包含的是模型主要变量以外的信息。我仍用居民支出举例,如:
Y=aX1+bX2+c+随机误差项..........(1)
Y代表居民支出;X1代表居民收入;X2代表家庭财富;c是常数,即居民基本消费。这时,随机误差项代表的是:GDP、消费者价格指数、工业品价格指数、本币汇率、大宗商品价格指数、房价均值、子女教育费均值等等等等。我们知道,收入和财富是决定居民支出较为直接的变量,所以我们将其引入模型中,而宏观经济情况和价格水平都是间接影响着居民支出的。如果我们需要更详细全面的模型,那么我们需要引入更多的变量;但引入更多变量的成本也较大,比如多重共线、自相关问题等等。所以模型利用随机误差项将该部分庞大而对因变量影响不大的变量们都统一在一起表示,并且由于这些变量们对因变量的影响有正有负亦可相互抵消,只是影响模型的设定全面性而已。虽然如此,任意将模型的变量放入随机误差项也是不对的,比如:上述模型可以改为:
Y=aX1+c+随机误差项..........(2)
我们可以看到,家庭财富被挪入随机误差项,这是可以的,但是模型存在设定偏误,即模型忽略了家庭富足,而收入不高,靠有钱的老爹过着花天酒地生活的人群,而这种人群我们不能证明其是大还是小,就很有可能对模型产生较大影响。好吧,直接公布答案,通过很多学者的研究,在模型(1)中我们得到的那条曲线更真实,所以我们刚才说的那种靠爹吃饭的人还真不是少数。所以模型(2)是有问题的。当然这不证明模型(1)就完全没有问题,模型(1)存在较为严重的多重共线问题,即收入和家庭财富是相关性非常高的。不管他,扯远了,我们是为了解释随机误差项的含义,怎么合理利用需要大量的阅读……
如果你让我从数学式上对随机误差项进行解释,我只能说其期望值是0,方差好像是1,忘记了。刚才说的模型(2)至少就不符合期望值是0的假设,所以模型(2)是有问题的。当然这都是理论的假设前提,在这些前提下,模型是有效的,我们也称之为BLUE,如果前提被破坏,我们就要对模型进行调整和修正以使之回归BLUE的结果。所谓BLUE就是模型符合:无偏性、有效性、一致性。无偏性就是估计值的期望值等于实际值;有效性就是估计值是方差最小的;一致性就是估计值依概率收敛到实际值

0 条回复

暂无讨论,说说你的看法吧!

 回复

你需要  登录  或  注册  后参与讨论!