数据分析和计量经济学常用的专业术语
Baike · 2012-02-22 22:35 · 75173 次点击
A
校正R2(AdjustedR-Squared):多元回归分析中拟合优度的量度,在估计误差的方差时对添加的解释变量用一个自由度来调整。
对立假设(AlternativeHypothesis):检验虚拟假设时的相对假设。
AR(1)序列相关(AR(1)SerialCorrelation):时间序列回归模型中的误差遵循AR(1)模型。
渐近置信区间(AsymptoticConfidenceInterval):大样本容量下近似成立的置信区间。
渐近正态性(AsymptoticNormality):适当正态化后样本分布收敛到标准正态分布的估计量。
渐近性质(AsymptoticProperties):当样本容量无限增长时适用的估计量和检验统计量性质。
渐近标准误(AsymptoticStandardError):大样本下生效的标准误。
渐近t统计量(AsymptotictStatistic):大样本下近似服从标准正态分布的t统计量。
渐近方差(AsymptoticVariance):为了获得渐近标准正态分布,我们必须用以除估计量的平方值。
渐近有效(AsymptoticallyEfficient):对于服从渐近正态分布的一致性估计量,有最小渐近方差的估计量。
渐近不相关(AsymptoticallyUncorrelated):时间序列过程中,随着两个时点上的随机变量的时间间隔增加,它们之间的相关趋于零。
衰减偏误(AttenuationBias):总是朝向零的估计量偏误,因而有衰减偏误的估计量的期望值小于参数的绝对值。
自回归条件异方差性(AutoregressiveConditionalHeteroskedasticity,ARCH):动态异方差性模型,即给定过去信息,误差项的方差线性依赖于过去的误差的平方。
一阶自回归过程(AutoregressiveProcessofOrderOne):一个时间序列模型,其当前值线性依赖于最近的值加上一个无法预测的扰动。
辅助回归(AuxiliaryRegression):用于计算检验统计量——例如异方差性和序列相关的检验统计量——或其他任何不估计主要感兴趣的模型的回归。
平均值(Average):n个数之和除以n。
B
基组、基准组(BaseGroup):在包含虚拟解释变量的多元回归模型中,由截距代表的组。
基期(BasePeriod):对于指数数字,例如价格或生产指数,其他所有时期均用来作为衡量标准的时期。
基期值(BaseValue):指定的基期的值,用以构造指数数字;通常基本值为1或100。
最优线性无偏估计量(BestLinearUnbiasedEstimator,BLUE):在所有线性、无偏估计量中,有最小方差的估计量。在高斯—马尔科夫假定下,OLS是以解释变量样本值为条件的BLUE。
贝塔系数(BetaCoef?cients):见标准化系数。
偏误(Bias):估计量的期望参数值与总体参数值之差。
偏误估计量(BiasedEstimator):期望或抽样平均与假设要估计的总体值有差异的估计量。
向零的偏误(BiasedTowardsZero):描述的是估计量的期望绝对值小于总体参数的绝对值。
二值响应模型(BinaryResponseModel):二值因变量的模型。
二值变量(BinaryVariable):见虚拟变量。
两变量回归模型(BivariateRegressionModel):见简单线性回归模型。
BLUE(BLUE):见最优线性无偏估计量。
Breusch-Godfrey检验(Breusch-GodfreyTest):渐近正确的AR(p)序列相关检验,以AR(1)最为流行;该检验考虑到滞后因变量和其他不是严格外生的回归元。
Breusch-Pagan检验(Breusch-PaganTest):将OLS残差的平方对模型中的解释变量做回归的异方差性检验。
C
因果效应(CausalEffect):一个变量在其余条件不变情况下的变化对另一个变量产生的影响。
其余条件不变(CeterisParibus):其他所有相关因素均保持固定不变。
经典含误差变量(ClassicalErrors-in-Variables,CEV):观测的量度等于实际变量加上一个独立的或至少不相关的测量误差的测量误差模型。
经典线性模型(ClassicalLinearModel):全套经典线性模型假定下的复线性回归模型。
经典线性模型(CLM)假定(ClassicalLinearModel(CLM)Assumptions):对多元回归分析的理想假定集,对横截面分析为假定MLR.1至MLR.6,对时间序列分析为假定TS.1至TS.6。假定包括对参数为线性、无完全共线性、零条件均值、同方差、无序列相关和误差正态性。
科克伦—奥克特(CO)估计(Cochrane-Orcutt(CO)Estimation):估计含AR(1)误差和严格外生解释变量的多元线性回归模型的一种方法;与普莱斯—温斯登估计不同,科克伦—奥克特估计不使用第一期的方程。
置信区间(CI)(Con?denceInterval,CI):用于构造随机区间的规则,以使所有数据集中的某一百分比(由置信水平决定)给出包含总体值的区间。
置信水平(Con?denceLevel):我们想要可能的样本置信区间包含总体值的百分比,95%是最常见的置信水平,90%和99%也用。
不变弹性模型(ConstantElasticityModel):因变量关于解释变量的弹性为常数的模型;在多元回归中,两者均以对数形式出现。
同期外生回归元(ContemporaneouslyExogenous):在时间序列或综列数据应用中,与同期误差项不相关但对其他时期则不一定的回归元。
控制组(ControlGroup):在项目评估中,不参与该项目的组。
控制变量(ControlVariable):见解释变量。
协方差平稳(CovarianceStationary):时间序列过程,其均值、方差为常数,且序列中任意两个随机变量之间的协方差仅与它们的间隔有关。
协变量(Covariate):见解释变量。
临界值(CriticalValue):在假设检验中,用于与检验统计量比较来决定是否拒绝虚拟假设的值。
横截面数据集(Cross-SectionalDataSet):在给定时点上从总体中收集的数据集
D
数据频率(DataFrequency):收集时间序列数据的区间。年度、季度和月度是最常见的数据频率。
戴维森—麦金农检验(Davidson-MacKinnonTest):用于检验相对于非嵌套对立假设的模型的检验:它可用相争持模型中得出的拟合值的t检验来实现。
自由度(df)(DegreesofFreedom,df):在多元回归模型分析中,观测值的个数减去待估参数的个数。
分母自由度(DenominatorDegreesofFreedom):F检验中无约束模型的自由度。
因变量(DependentVariable):在多元回归模型(和其他各种模型)中被解释的变量。
除趋势(Detrending):从时间序列中除去趋势的做法。
斜率级差(DifferenceinSlopes):所描述的是模型中某些斜率参数,因组或时期的不同而不同。
向下偏误(DownwardBias):估计量的期望值低于参数的总体值。
虚拟变量(DummyVariable):取值为0或1的变量。
虚拟变量陷阱(DummyVariableRegression):自变量中包含了过多的虚拟变量造成的错误;当模型中既有整体截距又对每一组都设有一个虚拟变量时,该陷阱就产生了。
德宾—沃森(DW)统计量(Durbin-Watson(DW)Statistic):在经典线性回归假设下,用于检验时间序列回归模型的误差项中的一阶序列相关的统计量。
动态完整模型(DynamicallyCompleteModel):设更多的滞后因变量,或设更多的滞后解释变量都无助于解释因变量的均值的时间序列模型。