上QQ阅读APP看书,第一时间看更新
第一节 多元线性回归模型概述
一、多元线性回归模型的一般形式
▶1.时间序列数据形式
式中,k为解释变量的数目;βi为模型参数;μ为随机误差项。常数项β0可被看作一虚变量的系数,该虚变量的样本观测值始终取1,则模型中解释变量的数目为(k+1)。
▶2.面板数据形式
Yi=β0+β1Xi1+β2Xi2+…+βkXik+μi,改成矩阵形式为
二、样本容量问题
模型参数估计是建立在被解释变量和解释变量的大量样本观测值的基础上运算完成的,其精度对样本数据的依赖性很大,通常样本数目越多精度越高。当然,也得考虑样本数据效果的有用性和时间的一致性等。例如,要分析我国当代经济发展规律,一般选择社会经济数据从1978年(党的十一届三中全会)开始。
▶1.最小样本容量
从普通最小二乘法原理出发,不管其质量如何,欲能得出参数估计量,所要求的样本容量的下限必须不少于模型中解释变量的数目(包括常数项),即n≥k+1。
▶2.满足基本要求的样本容量
当样本数目n满足不少于模型中解释变量的数目(包括常数项)k+1时,但n还是太小,除了参数估计质量不高外,一些后续统计检验工作难以实现。例如,当n≥8+k时,t分布较为稳定;当n>30时,Z检验才能应用。
回归模型的良好性质,只有在大样本容量下才能在理论上真正得到实现。计量经济学一般实证经验表明,当n≥30,或者至少n≥3(k+1)时,才满足模型估计的基本统计要求。