计量经济学(第四版)
习题参
潘省初
1 / 44
第一章 绪论
1.1 一般说来,计量经济分析按照以下步骤进行:
(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和分析
1.2 我们在计量经济模型中列出了影响因变量的解释变量,但它(它们)仅是影响因变量的主要因素,还有很多对因变量有影响的因素,它们相对而言不那么重要,因而未被包括在模型中。为了使模型更现实,我们有必要在模型中引进扰动项u来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。
1.4 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。在一项应用中,依据估计量算出的一个具体的数值,称为估计值。如Y就是一个估计量,YYi1nin。现有一样本,共4个数,100,104,96,130,
则根据这个样本的数据运用均值估计量得出的均值估计值为
10010496130107.5。
4第二章 计量经济分析的统计学基础
2.1 略,参考教材。 2.2 SxS5 ==1.25 4N2 / 44
用=0.05,N-1=15个自由度查表得t0.005=2.947,故99%置信限为 Xt0.005Sx =174±2.947×1.25=174±3.684
也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。 2.3 原假设 H0:120
备择假设 H1:120 检验统计量
(X)X(130120)10/25
10/25查表Z0.0251.96 因为Z= 5 >Z0.0251.96,故拒绝原假设, 即 此样本不是取自一个均值为120元、标准差为10元的正态总体。 2.4 原假设 : H0:2500
备择假设 : H1:2500 t(X)(26002500)100/1200.83 ˆX480/16查表得 t0.025(161)2.131 因为t = 0.83 < tc2.131, 故接受原假 设,即从上次调查以来,平均月销售额没有发生变化。
第三章 双变量线性回归模型
3.1 判断题(说明对错;如果错误,则予以更正) (1)对 (2)对 (3)错
只要线性回归模型满足假设条件(1)~(4),OLS估计量就是BLUE。 (4)对
3 / 44
(5)错
R2 =ESS/TSS。 (6)对
(7)错。我们可以说的是,手头的数据不允许我们拒绝原假设。
ˆ)(8)错。因为Var(3.2 证明:
ˆYXˆˆYXXYxiyi2i2xtyixi2i2,只有当xt保持恒定时,上述说法才正确。
2xˆXYyxyyiiii2ii22
22xiyi(xiyi)2xyxy2ir23.3 (1)
ˆe)Y(YˆeYY
ˆe=0,YYtttttttttˆeYtYtt两边除以n,得YYˆY,即Y的真实值和拟合值有共同的均值。 nn(2)
ˆX)eˆˆeˆˆeY(Xe由于e0,Xe0(教材中已证明),ˆe0,即因此, YˆeYˆCov(Y,e)=0,Y的拟合值与残差无关。ˆYetttttttttttttttt22tt3.4 (1)
4 / 44
ˆX,YXuˆYˆ)Xˆu(2ˆ)X(ˆ)2X2ˆ)(u22u((u)i2n22uxunxittt2ˆ)2X2X(xnun)ˆ)2X2X(
(ui)2n22(u1un)(x1u1nxt2uiuiujnij2xu22ii(xixj)uiujijnxt2ˆ)2X2X(两边取期望值,有:ui2uiujij2ˆ)E(E2n等式右端三项分别推导如下:ui2uiujijEn2xiui2(xixj)uiujij2ˆ)2+XE(2-2XEnxt12n2(E(ui)2E(uiuj))ijn222nxiui2(xixj)uiujij2XEnxt22X21nxt2(xiE(ui)(xixj)E(uiuj))2X2ij2xinxt20(x=0)iX222ˆXE()xt2因此22222X22(xtnX)Xtˆ)]E([022nnxtnxt2xt22ˆ)即Var((2)
2Xt2nxt2
5 / 44
ˆX,YXuˆYˆ)Xˆu(ˆ)Eˆ)]E[(u(ˆ)X)(ˆ)]ˆ,ˆ)Cov(([(ˆ)]XE[(ˆ)2]E[(u(
2ˆ)(第一项为0XE(0的证明见本题())1ˆ)XVar(X2xt2ˆYˆX,注意到 3.5(1)12xiXiX,xi0,从而x0,则我们有ˆ1=Yˆ2x=Yˆ)Var(1ˆ1)Var(2Xi2nxi2
2xi2n(xix)22xi2nxi22n由上述结果,可以看到,无论是两个截距的估计量还是它们的方差都不相同。 (2)
ˆ2xyxi2iiˆ2,(xx)(YY)xy(xx)xiii22ii22iˆ)Var(ˆ容易验证,Var()=22
xi这表明,两个斜率的估计量和方差都相同。
3.6(1)斜率的值 -4.318表明,在1980-1994期间,相对价格每上升一个单位,(GM/$)汇率下降约4.32个单位。也就是说,美元贬值。截距项6.682的含义是,如果相对价格为0,1美元可兑换6.682马克。当然,这一解释没有经济意义。
(2)斜率系数为负符合经济理论和常识,因为如果美国价格上升快于德国,则美国消费者将倾向于买德国货,这就增大了对马克的需求,导致马克的升值。 (3)在这种情况下,斜率系数被预期为正数,因为,德国CPI相对于美国CPI越高,德国相对的通货膨胀就越高,这将导致美元对马克升值。
6 / 44
3.7(1)
ˆeight76.261.31*177.67156.49Wˆeight76.261.31*1.98139.86 Wˆeight76.261.31*187.82169.78Wˆeight1.31*height1.31*3.814.99 (2)W3.8 (1) 序号 1 2 3 4 5 6 7 8 9 10 ∑ Yt Xt 11 10 10 7 12 10 6 5 ytYtY 1.4 0.4 2.4 -3.6 0.4 -2.6 -0.6 0.4 1.4 0.4 0 xtXtX 2 -1 2 -3 0 0 -2 -1 1 2 0 xtyt xt2 2.8 4 yt2 Xt2 1.96 100 0.16 49 -0.4 1 4.8 4 5.76 100 10.8 9 12.96 25 0 0 1.2 0 0 4 0.16 6.76 0.36 0.16 1.96 36 49 81 10 8 7 9 8 6 10 7 11 9 10 10 96 80 -0.4 1 1.4 0.8 21 1 4 0.16 100 28 30.4 668 YYtn96/109.6 XXtn80/108
ˆ3.60.75X 估计方程为: Ytt(2)
ˆxy)(n2)ˆ2et2(n2)(yt2tt(30.40.75*21)/81.83125ˆxyttx2tˆ*X9.60.75*83.6 ˆY21/280.75
7 / 44
ˆ/Se(ˆ)tˆˆx2t2t2.934
ˆ/Se(ˆ)tˆˆXnxt221.733
R2(xtytxt222y)(21/28*30.4)0.518 t回归结果为(括号中数字为t值):
ˆ3.60.75X R2=0.518 Ytt (1.73) (2.93) 说明:
Xt的系数符号为正,符合理论预期,0.75表明劳动工时增加一个单位,产量增加0.75个单位,
拟合情况。 R2为0.518,作为横截面数据,拟合情况还可以.
系数的显著性。斜率系数的t值为2.93,表明该系数显著异于0,即Xt对Yt有影响.
(3) 原假设 : H0:1.0
备择假设 : H1:1.0
ˆ1.0)/Se(ˆ)(0.751.0)/0.25560.978 检验统计量 t(查t表, tct0.025(8)2.306 ,因为│t│= 0.978 < 2.306 ,
故接受原假设:3.9
1.0。
ˆ0=10+0.90*250=235.0 对于x0=250 ,点预测值 yˆ0 的95%置信区间为: yˆ0t0.025(122)*ˆ11/n(X0X)2yx2
2352.228*0.1*11/12(250200)2/40002350.29
即 234.71 - 235.29。也就是说,我们有95%的把握预测y0将位于234.71 至
8 / 44
235.29 之间.
3.10(1)列表计算如下: 序号 1 2 3 4 5 ∑ Yt Xt 1 3 5 2 4 6 11 17 8 13 ytYtY xtXtX xtyt -2 0 2 -1 1 0 -5 0 6 -3 2 0 10 0 12 3 2 27 xt2 25 0 36 9 4 74 yt2 4 0 4 1 1 10 Xt2 36 121 2 169 679 15 55 YYtn15/53 XXtn55/511
ˆxytt2xt27/740.365ˆ*X30.365*111.015 ˆYˆ1.0150.365X 我们有:Ytt (2)
ˆxy)(n2)(100.365*27)/30.048 2et2(n2)(yt2ttR2(xtytxt222y)(27/74*10)0.985 t2ˆ=-1.015+0.365*10=2.635 (3) 对于X0=10 ,点预测值 Y0Y0 的95%置信区间为:
ˆtˆ11/n(X0X)2Y00.025(52)*x2
=2.6353.182*0.048*11/5(1011)2/742.6350.770 即 1.5 -3.099,也就是说,我们有95%的把握预测Y0将位于1.865 至3.405 之间.
3.11 问题可化为“预测误差是否显著地大?”
9 / 44
ˆ1.0150.365206.285 当X0 =20时,Y0ˆ7.626.2851.335 预测误差 e0Y0Y0原假设H0:E(e0)0 备择假设H1:E(e0)0 检验:
若H0为真,则
te0E(e0)1(X0X)2ˆ1nx21.33501(2011)20.04815741.3354.021 0.332对于5-2=3个自由度,查表得5%显著性水平检验的t临界值为:
tc3.182 结论:
由于t4.0213.182
故拒绝原假设H0,接受备则假设H1,即新观测值与样本观测值来自不同的总体。 3.12 (1)原假设 H0:0 备择假设 H1:0
ˆ0)(检验统计量 tˆ)6.5 Se(查t表,在5%显著水平下 t0.025(1911)2.11 ,因为t=6.5>2.11 故拒绝原假设,即0,说明收入对消费有显著的影响。 (2)由回归结果,立即可得:
ˆ)155.556 Se(2.7ˆ)0.810.125 Se(6.5(3)的95%置信区间为:
10 / 44
ˆtSe(ˆ)0.812.11*0.1250.810.22 即为0.546~1.074,也就是说有95%的把握说在0.546~1.074
之间,所以在这个区间中不包括0。3.13 回归之前先对数据进行处理。把名义数据转换为实际数据,公式如下: 人均消费C=C/P*100(价格指数)
人均可支配收入Y=[Yr*rpop/100+Yu*(1-rpop/100)]/P*100 农村人均消费Cr=Cr/Pr*100
城镇人均消费Cu=Cu/Pu*100
农村人均纯收入Yr=Yr/Pr*100 城镇人均可支配收入Yu=Yu/Pu*100 处理好的数据如下表所示:
年份 1985 1986 1987 1988 19 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 C 401.78 436.93 456.14 470.23 444.72 4.88 491. 516.77 550.41 596.23 6.35 6.69 711.96 737.16 785.69 854.25 910.11 Y 478.57 507.48 524.26 522.22 502.13 547.15 568.03 620.43 665.81 723.96 780.49 848.30 7.63 957.91 1038.97 1103.88 1198.27 Cr 317.42 336.43 353.41 360.02 339.06 354.11 366.96 372.86 382.91 410.00 449.68 500.03 501.75 498.38 501.88 531. 550.11 Cu 673.20 746.66 759.84 785.96 741.38 773.09 836.27 885.34 962.85 1040.37 1105.08 1125.36 1165.62 1213.57 1309.90 1407.33 1484.62 Yr 397.60 399.43 410.47 411.56 380.94 415.69 419.54 443.44 458.51 492.34 541.42 612.63 8.50 677.53 703.25 717. 747.68 Yu 739.10 840.71 861.05 841.08 842.24 912.92 978.23 1073.28 1175.69 1275.67 1337.94 13.35 1437.05 1519.93 1661.60 1768.31 1918.23 11 / 44
2002 2003 1032.78 1114.40 1344.27 1467.11 581.95 606.90 1703.24 1822.63 785.41 818.93 2175.79 2371.65
根据表中的数据用软件回归结果如下:
Ct= 90.93 + 0.692Yt R2=0.997
t: (11.45) (74.82) DW=1.15
农村:Crt= 106.41 + 0.60Yrt R2=0.979
t: (8.82) (28.42) DW=0.76
城镇:Cut= 106.41 + 0.71Yut R2=0.998
t: (13.74) (91.06) DW=2.02
从回归结果来看,三个方程的R2都很高,说明人均可支配收入较好地解释了人均消费支出。
三个消费模型中,可支配收入对人均消费的影响均是显著的,并且都大于0小于1,符合经济理论。而斜率系数最大的是城镇的斜率系数,其次是全国平均的斜率,最小的是农村的斜率。说明城镇居民的边际消费倾向高于农村居民。
第四章 多元线性回归模型
4.1 应采用(1),因为由(2)和(3)的回归结果可知,除X1外,其余解释变量的系数均不显著。(检验过程略) 4.2 (1) 斜率系数含义如下:
0.273: 年净收益的土地投入弹性, 即土地投入每上升1%, 资金投入不
变的情况下, 引起年净收益上升0.273%.
0.733: 年净收益的资金投入弹性, 即资金投入每上升1%, 土地投入不变的情况下, 引起年净收益上升0.733%.
12 / 44
(n1)(1R2)8*(10.94)R110.92,表明模型 拟合情况:
nk19212拟合程度较高.
(2) 原假设 H0:0
备择假设 H1:0
ˆ检验统计量 tˆ)Se(0.273/0.1352.022
查表,t0.025(6)2.447 因为t=2.022 ˆ检验统计量 tˆ)0.733/0.1255.8 Se(查表,t0.025(6)2.447 因为t=5.8>t0.025(6),故拒绝原假设,即β显著异于0,表明资金投入变动对年净收益变动有显著的影响. (3) 原假设 H0:0 备择假设 H1: 原假设不成立 检验统计量 R2/k0.94/2F47 2(1R)/(nk1)(10.94)/(921)查表,在5%显著水平下F(2,6)5.14 因为F=47>5.14,故拒绝原假设。 结论,:土地投入和资金投入变动作为一个整体对年净收益变动有影响. 4.3 检验两个时期是否有显著结构变化,可分别检验方程中D和D•X的系数是否显著异于0. (1) 原假设 H0:20 备择假设 H1:20 13 / 44 检验统计量 ˆt2ˆ)1.4839/0.47043.155 Se(2查表t0.025(184)2.145 因为t=3.155>t0.025(14), 故拒绝原假设, 即2显著异于0。 (2) 原假设 H0:40 备择假设 H1:40 检验统计量 tˆ40.1034/0.03323.115 ˆSe(4)查表t0.025(184)2.145 因为|t|=3.155>t0.025(14), 故拒绝原假设, 即4显著异于0。 结论:两个时期有显著的结构性变化。 ,模型可线性化。4.4 (1)参数线性,变量非线性 设z111,z22,则模型转换为 y01z12z2u xx (2)变量、参数皆非线性,无法将模型转化为线性模型。 (3)变量、参数皆非线性,但可转化为线性模型。 取倒数得: 11e(01xu) yyy01xu,令zln,则有 1y1y把1移到左边,取对数为:lnz01xu 4.5 (1)截距项为-58.9,在此没有什么意义。X1的系数表明在其它条件不变时,个人年消费量增加1百万美元,某国对进口的需求平均增加20万美元。X2的系数表明在其它条件不变时,进口商品与国内商品的比价增加1单位,某国对进口的需求平均减少10万美元。 (2)Y的总变差中被回归方程解释的部分为96%,未被回归方程解释的部分为4%。 (3)检验全部斜率系数均为0的原假设。 14 / 44 0.96/2R2/kESS/k192 F=(1R2)/(nk1)RSS/(nk1)0.04/16由于F=192 应变量Y。 F0.05(2,16)=3.63,故拒绝原假设,回归方程很好地解释了 (4) A. 原假设H0:β1= 0 备择假设H1:β1 0 ˆ0.2t121.74 ˆ0.0092S(1) t0.025(16)=2.12, 故拒绝原假设,β1显著异于零,说明个人消费支出(X1)对进口需求有解释作用,这个变量应该留在模型中。 B. 原假设H0:β2=0 备择假设H1:β2 0 ˆ0.12t1.19 t1.344.469 0.32得到这样一个t值的概率(P值)极低。可是,该弹性系数不显著异于-1,因为在弹性真值为-1的原假设下,t值为: t1.34(1)1.06 0.32这个t值在统计上是不显著的。 (2)收入弹性虽然为正,但并非统计上异于0,因为t值小于1(t0.170.200.85)。 (3)由R21(1R2)n1,可推出 R21(1R2)nk1 n1nk1本题中,R=0.27,n=46,k=2,代入上式,得R=0.3026。 4.7 (1)薪金和每个解释变量之间应是正相关的,因而各解释变量系数都应为正,估计结果确实如此。 2215 / 44 系数0.280的含义是,其它变量不变的情况下,CEO薪金关于销售额的弹性为0.28; 系数0.0174的含义是,其它变量不变的情况下,如果股本收益率上升一个百分点(注意,不是1%),CEO薪金的上升约为1.07%; 与此类似,其它变量不变的情况下,公司股票收益上升一个单位,CEO薪金上升0.024%。 (2)用回归结果中的各系数估计值分别除以相应的标准误差,得到4个系数的t值分别为:13.5、8、4.25和0.44。用经验法则容易看出,前三个系数是统计上高度显著的,而最后一个是不显著的。 (3)R2=0.283,拟合不理想,即便是横截面数据,也不理想。 4.8 (1)2.4%。 (2)因为Dt和(Dt t)的系数都是高度显著的,因而两时期人口的水平和增 长率都不相同。1972-1977年间增长率为1.5%,1978-1992年间增长率为2.6%(=1.5%+1.1%)。 4.9 原假设H0: β1 =β2,β3 =1.0 备择假设H1: H0不成立 若H0成立,则正确的模型是: Yβ0β1(X1X2)X3u 据此进行有约束回归,得到残差平方和SR。 若H1为真,则正确的模型是原模型: Yβ0β1X1β2X2β3X3u 据此进行无约束回归(全回归),得到残差平方和S。 检验统计量是: Fg~F(g,n-K-1) S(nK1)SRS用自由度(2,n-3-1)查F分布表,5%显著性水平下,得到FC , 如果F< FC, 则接受原假设H0,即β1 =β2,β3 =0; 如果F> FC, 则拒绝原假设H0,接受备择假设H1。 16 / 44 1大型企业1中型企业 4.10 (1)2个,D1D20其他0其他(2)4个, 1高中1小学1初中1大学 D1D2D3D40其他0其他0其他0其他4.11 yt01D2xt3(Dxt)ut,其中D0D1, 4.12 对数据处理如下: lngdp=ln(gdp/p) lnk=ln(k/p) lnL=ln(L/P) 对模型两边取对数,则有 lnY=lnA+ lnK+ lnL+lnv t1979t1979 用处理后的数据回归,结果如下: ˆdp0.260.96lnk0.18lnl R20.97 lngt:(-0.95) (16.46) (3.13) 由修正决定系数可知,方程的拟合程度很高;资本和劳动力的斜率系数均显著(tc=2.048), 资本投入增加1%,gdp增加0.96%,劳动投入增加1%,gdp增加0.18%,产出的资本弹性是产出的劳动弹性的5.33倍。 第五章 模型的建立与估计中的问题及对策 5.1 (1)对 (2)对 (3)错 即使解释变量两两之间的相关系数都低,也不能排除存在多重共线性的可能性。 17 / 44 (4)对 (5)错 在扰动项自相关的情况下OLS估计量仍为无偏估计量,但不再具有最小方差的性质,即不是BLUE。 (6)对 (7)错 模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。 (8)错。 在多重共线性的情况下,尽管全部“斜率”系数各自经t检验都不显著, R2值仍可能高。 (9)错。 存在异方差的情况下,OLS法通常会高估系数估计量的标准误差,但不总是。 (10)错。 异方差性是关于扰动项的方差,而不是关于解释变量的方差。 5.2 对模型两边取对数,有 lnYt=lnY0+t*ln(1+r)+lnut , 令LY=lnYt,a=lnY0,b=ln(1+r),v=lnut,模型线性化为: LY=a+bt+v 估计出b之后,就可以求出样本期内的年均增长率r了。 5.3(1)DW=0.81,查表(n=21,k=3,α=5%)得dL=1.026。 DW=0.81<1.026 结论:存在正自相关。 (2)DW=2.25,则DW´=4 – 2.25 = 1.75 查表(n=15, k=2, α=5%)得du =1.543。 1.543<DW´= 1.75 <2 结论:无自相关。 (3)DW= 1.56,查表(n=30, k=5, α=5%)得dL =1.071, du =1.833。 18 / 44 1.071<DW= 1.56 <1.833 结论:无法判断是否存在自相关。 5.4 (1) 横截面数据. (2) 不能采用OLS法进行估计,由于各个县经济实力差距大,可能存在异方差 性。 (3) GLS法或WLS法。 5.5 (1)可能存在多重共线性。因为①X3的系数符号不符合实际.②R2很高,但解释变量的t值低:t2=0.9415/0.8229=1.144, t3=0.0424/0.0807=0.525. 解决方法:可考虑增加观测值或去掉解释变量X3. (2)DW=0.8252, 查表(n=16,k=1,α=5%)得dL=1.106. DW=0.8252< dL=1.106 结论:存在自相关. 单纯消除自相关,可考虑用科克伦-奥克特法或希尔德雷斯-卢法;进一步研究,由于此模型拟合度不高,结合实际,模型自相关有可能由模型误设定引起,即可能漏掉了相关的解释变量,可增加相关解释变量来消除自相关。 5.6 存在完全多重共线性问题。因为年龄、学龄与工龄之间大致存在如下的关系:Ai=7+Si+Ei 解决办法:从模型中去掉解释变量A,就消除了完全多重共线性问题。 5.7 (1)若采用普通最小二乘法估计销售量对广告宣传费用的回归方程,则系数的估计量是无偏的,但不再是有效的,也不是一致的。 (2)应用GLS法。设原模型为 yi01xiui (1) 由于已知该行业中有一半的公司比另一半公司大,且已假定大公司的误差 2,i大公司222项方差是小公司误差项方差的两倍,则有i2i,其中i。 1,i小公司则模型可变换为 19 / 44 yii0xu1ii (2) iii此模型的扰动项已满足同方差性的条件,因而可以应用OLS法进行估计。 (3)可以。对变换后的模型(2)用戈德弗尔德-匡特检验法进行异方差性检验。如果模型没有异方差性,则表明对原扰动项的方差的假定是正确的;如果模型还有异方差性,则表明对原扰动项的方差的假定是错误的,应重新设定。 5.8(1)不能。因为第3个解释变量(MtMt1)是Mt和Mt1的线性组合,存在完全多重共线性问题。 (2)重新设定模型为 GNPt0(13)Mt(23)Mt1ut 01Mt2Mt1ut我们可以估计出0、1和2,但无法估计出1、2和3。 (3)所有参数都可以估计,因为不再存在完全共线性。 (4)同(3)。 5.9(1)R2很高,logK的符号不对,其 t值也偏低,这意味着可能存在多重共线性。 (2)logK系数的预期符号为正,因为资本应该对产出有正向影响。但这里估计出的符号为负,是多重共线性所致。 (3)时间趋势变量常常被用于代表技术进步。(1)式中,0.047的含义是,在样本期内,平均而言,实际产出的年增长率大约为4.7%。 (4)此方程隐含着规模收益不变的约束,即减缓多重共线性问题。 (5)资本-劳动比率的系数统计上不显著,看起来多重共线性问题仍没有得到解决。 (6)两式中R2是不可比的,因为两式中因变量不同。 5.10(1)所作的假定是:扰动项的方差与GNP的平方成正比。模型的估计者应该是对数据进行研究后观察到这种关系的,也可能用格里瑟法对异方差性形式进行了实验。 + =1,这样变换模型,旨在 20 / 44 (2)结果基本相同。第二个模型三个参数中的两个的标准误差比第一个模型低,可以认为是改善了第一个模型存在的异方差性问题。 5.11 我们有 RSS155ˆ1n1k125222ˆ32RSS3140 n3k12522原假设H0:13 备则假设H1:13 检验统计量为: ˆ3214025F22.5454 5525ˆ1用自由度(25,25)查F表,5%显著性水平下,临界值为:Fc=1.97。 因为F=2.5454>Fc=1.97,故拒绝原假设原假设H0:13。 结论:存在异方差性。 5.12 将模型变换为: 22Yt1Yt12Yt20(112)1(Xt1Xt12Xt2)t(2) 若1、2为已知,则可直接估计(2)式。一般情况下,1、2为未知,因此需要先估计它们。首先用OLS法估计原模型(1)式,得到残差et,然后估计: et1et12et2t ˆ1和ˆ2生成 其中t为误差项。用得到的1和2的估计值ˆ1Yt1ˆ2Yt2 YtYtˆ1Xt1ˆ2Xt2 XtXt令0(112),用OLS法估计 Yt1Xtt ˆ,从而得到原模型(1)的系数估计值ˆ和ˆ。 ˆ和即可得到110 5.13 (1)全国居民人均消费支出方程: 21 / 44 Ct= 90.93 + 0.692Yt R2=0.997 t: (11.45) (74.82) DW=1.15 DW=1.15,查表(n=19,k=1,α=5%)得dL=1.18。 DW=1.15<1.18 结论:存在正自相关。可对原模型进行如下变换: Ct -ρCt-1 = α(1-ρ)+β(Yt-ρYt-1)+(ut -ρut -1) ˆ1DW/2有ˆ=0.425 由令:C t= Ct –0.425Ct-1 t=α , Yt= Yt-0.425Yt-1 t + ,α’=0.575α 然后估计 C +βY εt ,结果如下: Ct= 55.57 + 0.688Yt R2=0.994 t:(11.45) (74.82) DW=1.97 DW=1.97,查表(n=19,k=1,α=5%)得du=1.401。 DW=1.97>1.18,故模型已不存在自相关。 (2)农村居民人均消费支出模型: 农村:Crt= 106.41 + 0.60Yrt R2=0.979 t: (8.82) (28.42) DW=0.76 DW=0.76,查表(n=19,k=1,α=5%)得dL=1.18。 DW=0.76<1.18,故存在自相关。 解决方法与(1)同,略。 (3)城镇:Cut= 106.41 + 0.71Yut R2=0.998 t: (13.74) (91.06) DW=2.02 DW=2.02,非常接近2,无自相关。 5.14 (1)用表中的数据回归,得到如下结果: ˆ =54.19 + 0.061X1 + 1.98*X2 + 0.03X3 - 0.06X4 R2=0.91 Yt: (1.41) (1.58) (3.81) (1.14) (-1.78) 22 / 44 根据tc(α=0.05,n-k-1=26)=2.056,只有X2的系数显著。 (2)理论上看,有效灌溉面积、农作物总播种面积是农业总产值的重要正向影响因素。在一定范围内,随着有效灌溉面积、播种面积的增加,农业总产值会相应增加。受灾面积与农业总产值呈反向关系,也应有一定的影响。而从模型看,这些因素都没显著影响。这是为什么呢? 这是因为变量有效灌溉面积、施肥量与播种面积间有较强的相关性,所以方程存在多重共线性。现在我们看看各解释变量间的相关性,相关系数矩阵如下: X1 X2 X3 X4 1 0.6 0.880 0.715 0.6 1 0.5 0.685 0.880 0.5 1 0.883 0.715 0.685 0.883 1 X1 X2 X3 X4 表中r12=0.6,r13=0.5,说明施肥量与有效灌溉面积和播种面积间高度相关。 我们可以通过对变量X2的变换来消除多重共线性。令X22=X2/X3(公斤/亩),这样就大大降低了施肥量与面积之间的相关性,用变量X22代替X2,对模型重新回归,结果如下: ˆ =-233.62 + 0.088X1 + 13.66*X2 + 0.096X3 - 0.099X4 R2=0.91 Yt: (-3.10) (2.48) (3.91) (4.77) (-3.19) 从回归结果的t值可以看出,现在各个变量都已通过显著性检验,说明多重共线性问题基本得到解决。 第六章 动态经济模型:自回归模型和分布滞后模型 6.1(1)错。使用横截面数据的模型就不是动态模型。 (2)对。 (3)错。估计量既不是无偏的,又不是一致的。 23 / 44 (4)对。 (5)错。将产生一致估计量,但是在小样本情况下,得到的估计量是有偏的。 (6)对。 6.2 对于科克模型和适应预期模型,应用OLS法不仅得不到无偏估计量,而且也得不到一致估计量。 但是,部分调整模型不同,用OLS法直接估计部分调整模型,将产生一致估计值,虽然估计值通常是有偏的(在小样本情况下)。 6.3 科克方法简单地假定解释变量的各滞后值的系数(有时称为权数)按几何级数递减,即: Yt =α+βXt +βλXt-1 +βλ2Xt-2 +…+ ut 其中 0<λ<1。 这实际上是假设无限滞后分布,由于0<λ<1, X的逐次滞后值对Y的影响是逐渐递减的。 而阿尔蒙方法的基本假设是,如果Y依赖于X的现期值和若干期滞后值,则权数由一个多项式分布给出。由于这个原因,阿尔蒙滞后也称为多项式分布滞后。即在分布滞后模型 Yt0Xt1Xt1mXtmut中,假定: ia0a1ia2i2apip其中p为多项式的阶数。也就是用一个p阶多项式来拟合分布滞后,该多项式曲线通过滞后分布的所有点。 6.4 (1)估计的Y值是非随机变量X1和X2的线性函数,与扰动项v无关。 (2)与利维顿方法相比,本方法造成多重共线性的风险要小一些。 6.5(1) Mt01(11)Yt12(11)Yt12(12)Rt21(12)Rt1 (12)Mt1(12)Mt2[ut(12)ut1(12)ut2]其中0是、1和2的函数。(2) 第(1)问中得到的模型高度参数非线性,它的参数需采用非线性回归技 24 / 44 术来估计。 6.6 i01i2i2 0000 400411620142因此,变换模型为: 4YtiXtiut(01i2i2)Xtiut(01i2i2)Xtiuti0i04i04 2[4iXtiiXti]ut2ˆ2,即可得到ˆ14ˆ2,然后可得到诸用此式可估计出和的估计值。 6.7 (1)设备利用对通货膨胀的短期影响是Xt的系数:0.141;从长期看,在忽略扰动项的情况下,如果Yt趋向于某一均衡水平Y,则Xt和Xt-1也将趋向于某一均衡水平X: Y30.120.141X0.236XY30.120.377X即 所以,设备利用对通货膨胀的长期影响是Xt和Xt-1的系数之和:0.377。 (2)对模型的回归参数的显著性检验: 原假设:H0: β1 =0 备择假设:H1: β1 0 从回归结果可知,检验统计量t12.60 根据n-k-1=15,a=5%,查临界值表得tc=2.131。 由于t=2.60> tc=2.131 故拒绝原假设,即Xt对y有显著影响。 原假设:H0: β2 =0 备择假设:H1: β2 0 从回归结果可知,检验统计量t24.26 根据n-k-1=15,a=5%,查临界值表得tc=2.131。 25 / 44 由于t=4.26> tc=2.131 故拒绝原假设,即Xt-1对y有显著影响。 综上所述,所有的斜率系数均显著异于0,即设备利用和滞后一期的设备利用对通货膨胀都有显著的影响。 (3)对此回归方程而言,检验两个斜率系数为零,等于检验回归方程的显著性,可用F检验。 原假设:H0: β1 =β2 =0 检验统计量 备择假设:H1:原假设不成立 R2K0.727/2F19.973 (1R2)(nK1)(10.727)/(1821)根据k=2,n-k-1=15,a=5%,查临界值表得Fc=3.68。 由于F=19.973>Fc=3.68 故拒绝原假设,即Xt、Xt-1至少有一个变量对y有显著影响,表明方程总体是显著的。 6.8模型的滞后周期m=3,模型有6个参数,用二次多项式进行拟合,即p=2,得 Wia0a1ia2i2我们有: W0a0W1a0a1a2W2a02a14a2W3a03a19a2 代入原模型,得 YtWiXtiUti03(a0a1ia2i2)XtiUti03a0Xtia1iXtia2i2XtiUti0i0i033326 / 44 令:Z0t=∑Xt-i , Z1t=∑iXt-i , Z2t=∑i2Xt-i 显然,Z0t ,Z1t和Z2t可以从现有观测数据中得出,使得我们可用OLS法估计下式: Yta0Z0ta1Z1ta2Z2tut估计出α,α0,α1, α2的值之后,我们可以转换为 βWi的估计值,公式为: Wiaˆ0aˆ1iaˆ2i26.9 Yt* = βXt+1e (1) Yt-Yt-1 = δ(Yt* - Yt-1) + u t (2) Xt+1e - Xte = (1-λ)( Xt - Xte);t=1,2,…,n (3) 变换(3),得 Xt+1e = (1-λ)Xt +λXte (4) 因为Xt+1e无法表示成仅由可观测变量组成的表达式。但如果(4)式成立,则对于t期,它也成立,即: Xte = (1-λ)Xt-1 +λXt-1e (5) (5)代入(4),得: Xt+1e =(1-λ)Xt + (1-λ)λXt-1 +λ2Xt-1e (6) 我们可以用类似的方法,消掉(6)式中的Xte1, 这一过程可无限重复下去,最后得到: 2XXe(1λ)(XtλXλ)t1t1t2(7)将(7)代入(1), 得: 2XY*(1λ)(XtλXλ)t1t2t(1') 变换(2)得: Yt = δYt* - (1-δ)Yt-1 + u t (8) 将(1’)代入(8), 得: Yt(1)(XtXt12Xt2)(1)Yut1t(9) 27 / 44 (9)式两端取一期滞后,得: Yt1(1)(Xt1Xt22Xt3)(1)Yut1t2 (9)- λ(10),得: YYt1(1)Xt(1)Y(1)Yutut1tt1t2(10) (11)整理得: Y(1)Xt(1)Y(1)Yutut1tt1t2 该式不能直接采用OLS法进行估计, 因为存在Yt-1、Yt-2等随机解释变量,它们与扰动项相关, 并且扰动项存在序列相关。若采用OLS法, 得到的估计量既不是无偏的, 也不是一致的。可采用工具变量法或极大似然法进行估计。 28 / 44 第七章 时间序列分析 7.1 单项选择题 (1)A (2)D (3)B (4)B 7.2 一般来说,如果一个时间序列的均值和方差在任何时间保持恒定,并且两个时期t和t+k之间的协方差(或自协方差)仅依赖于两时期之间的距离(间隔或滞后)k,而与计算这些协方差的实际时期t无关,则该时间序列是平稳的。 只要这三个条件不全满足,则该时间序列是非平稳的。事实上,大多数经济时间序列是非平稳的。 实证分析中确定经济时间序列的性质的必要性在于,如果采用非平稳时间序列进行回归,则可能产生伪回归问题,不能确定回归结果一定正确。 7.3 大致说来,单位根这一术语意味着一给定的时间序列非平稳。专业点说,单位根指的是滞后操作符多项式A(L)的根。 7.4 DF检验是一种用于决定一个时间序列是否平稳的统计检验方法。EG检验法是一种用于决定两个时间序列是否协整的统计检验方法。 7.5 当回归方程中涉及的时间序列是非平稳时间序列时,OLS估计量不再是一致估计量,相应的常规推断程序会产生误导。这就是所谓的“伪回归”问题。 在回归中使用非均衡时间序列时不一定会造成伪回归,只要变量彼此同步,则这些变量间存在长期的线性关系. 7.6(1)因为||=2.35小于临界||值,表明住宅开工数时间序列是非平稳的。 (2)按常规检验,t的绝对值达到2.35,可判断为在5%水平上显著,但在单位根的情形下,临界|t|值是2.95而不是2.35。 (3)由于Xt1的||值远大于对应的临界值,因此,住宅开工数的一阶差分 Xt是平稳时间序列。 29 / 44 7.7 (1)∵R2=0.93﹥DW=0.3254 ∴认为A是伪回归 (2)∵R2< DW ∴认为B不是伪回归 (3)从C可以看出,τ=-2.2521 查表7-3变量数为2,样本容量为72.在5%的显著性水平下τ≈-3.46 ∵-2.2521>-3.46 ∴M1与GDP之间不存在协整关系,不改变(1)中的结论,认为A是伪回归。 如果M1与GDP的单整阶数不同,协整关系仍然不存在,A仍然是伪回归。 (4)此方程给出的是M1和GDP的对数之间的短期关系。这是因为给出的方程考虑了误差调整机制(ECM),它试图在两变量离开其长期通道的情况下,恢复均衡。可是,方程中误差项在5%水平上不显著。 如我们在(2)和(3)中所讨论的,由于协整检验的各结果相当混乱,使人难以得出所提供的回归结果A是否伪回归的明确结论。 7.8 用表中的人口(pop)时间序列数据,进行单位根检验,得到如下估计结果: 人口时间序列pop的单位根检验编号1.2.(t:)(t:)DF或ADF检验popt1509.900.0013popt1(4.88)(1.48)(0.40)*(0.85)(0.88)*popt3519.4460.37t0.042popt1 两种情况下,tδ值分别为-0.40和 -0.88,从Dickey-Fullerτ统计量临界值表中可以看出,两者分别大于从0.01到0.10的各种显著性水平下的值和T值。因此,两种情况下都不能拒绝原假设,即私人消费时间序列是非平稳序列。 下面看一下该序列的一阶差分(dpop)的平稳性。做类似于上面的回归,得到如下结果: 人口时间序列dpop的单位根检验编号t:t:DF或ADF检验(3.287)*(3.272)*(3.029)(2.811)(0.577)1.dpopt0.357dpopt1495.9652.dpopt0.358dpopt1560.8272.279t 其中△dpopt=dpopt-dpopt-1。两种情况下,tδ值分别为-3.287和-3.272,从 30 / 44 Dickey-Fullerτ统计量临界值表中可以看出,第一个检验小于从0.025到0.10的各种显著性水平下的值和T值;第二个检验小于0.10显著性水平下的τ值。因此,在0.10显著水平下,二者都拒绝原假设,即人口一阶差分时间序列没有单位根,或者说该序列是平稳序列。 综合以上结果,我们的结论是: dpopt是平稳序列,dpopt~I(0)。 而popt是非平稳序列,由于dpopt~I(0),因而popt~I(1)。 7.9 步骤一:求出三变量的单整的阶 (1)对三变量原序列的单位根检验 出口lnex的单位根检验编号DF或ADF检验(1.633)*2.lnext0.1800.007t0.041lnext1(0.95)*进口lnim的单位根检验编号1.2.DF或ADF检验lnimt0.0380.023lnimt1(1.385)*lnimt0.2630.012t0.074lnimt1(1.519)*1.lnext0.0150.02lnext1 价格指数lnpt的单位根检验编号1.2.DF或ADF检验lnptt0.0340.016lnptt1(1.068)*lnptt0.0350.002t0.031lnptt1(1.056)*从Dickey-Fullerτ统计量临界值表中可以看出,三个序列的tδ值分别大于从0.01到0.10的各种显著性水平下的值和T值。因此,三个序列的单位根检 31 / 44 验都不能拒绝原假设,即出口、进口、价格指数三个时间序列都是非平稳序列。 下面看一下这些序列的一阶差分的平稳性。做类似于上面的回归,得到如下结果: 出口序列dlnex的单位根检验编号1.2.DF或ADF检验dlnext0.0810.710dlnext1(5.112)*dlnext0.0230.002t0.766dlnext1(5.438)*进口序列dlnim的单位根检验编号1.2.DF或ADF检验dlnimt0.0690.639dlnimt1(4.723)*dlnimt0.00030.003t0.688dlnimt1(4.991)*价格序列dlnpt的单位根检验编号1.DF或ADF检验dlnptt0.0100.339dlnptt1(3.166)* 从Dickey-Fullerτ统计量临界值表中可以看出,两个差分序列dlnex、dlnim的tδ值分别小于从0.01到0.10的各种显著性水平下的值和T值;而差分序列dlnpt的tδ值分别小于从0.05到0.10的各种显著性水平下的值和T值。因此,三个差分序列的单位根检验都拒绝原假设,即出口、进口、价格指数三个差分时间序列都是平稳序列。这就是说, dlnext~I(0),dlnimt~I(0),dlnptt~I(0);而 lnext~I(1),lnimt~I(1),lnptt~I(1),因而我们可以进入下一步。 步骤二:进行协整回归,结果如下: LNEX =1.273+0.842*LNIM + 0.573*LNPT同时我们计算并保存残差(均衡误差估计值)et。 步骤三:检验et的平稳性。 D(et) = -0.450*et(-1) DW=1.992 (-4.405)*步骤四:得出有关两变量是否协整的结论。 32 / 44 查临界值,N=3,a=0.05,T=52的临界值是-4.11,而AEG=-4.405<-4.11,所以三个变量lnex、lnim、lnpt三个变量存在协整关系。 步骤五:建立ECM模型。 DLNEX = 0.757*DLNIM - 0.458*ET(-1) R2=0.618 t: (12.23) (-4.54) DW=1.788 方程的回归系数通过了 显著性检验,误差修正系数为负,符合反向修正机制。关于ECM模型dlnex的实际值、拟合值和残差的拟合图如下: 0.60.40.20.30.20.10.0-0.1-0.2556065707580859095Fitted00ResidualActual0.0-0.2-0.4-0.6 第八章 联立方程模型 8.1 (1)错。一般来说,不行。因为联立方程中变量的相互作用,因而结构方程中 往往包括随机解释变量。 (2)对。 (3)对。 (4)对。 (5)错。可以用3SLS法。 (6)对。 8.2 (1)C 33 / 44 (2)A (3)B (4)D (5)A (6)B (7)B (8)A 8.3 恒等式与行为方程的区别有以下两点: (1)恒等式不包含未知参数,而行为方程含有未知参数。 (2)恒等式中没有不确定性,而行为方程包含不确定性,因而在计量经济分析中需要加进随机扰动因子。 8.4 由于内生变量是联立地被决定,因此,联立方程模型中有多少个内生变量就必定有多少个方程。这个规则决定了任何联立方程模型中内生变量的个数。可是,确定哪个变量为内生变量,要根据经济分析和模型的用途。 在设定模型时,通常将以下两类变量设定为外生变量: (1)变量,如货币供给、税率、利率、支出等。 (2)短期内很大程度上是在经济系统之外决定或变化规律稳定的变量,如人口、劳动力供给、国外利率、世界贸易水平、国际原油价格等。 8.5 Ct = α + βDt +u t (1) It = γ + δDt-1 + νt (2) Dt = Ct + It + Zt; (3) 将(2)代入(3), 然后把(3)代入(1),得: Ct = α + β(Ct +γ + δDt-1 + νt + Zt )+u t 整理得: Ct -βCt = α + βγ + βδDt-1 + βνt + βZt +u t (1 –β)Ct = α + βγ + βδDt-1 +βZt +βνt +u t (1 –β)Ct = α + βγ + βδDt-1 +βZt +βνt +u t 34 / 44 Cttut Dt1Zt1111模型总变量个数k=5,方程个数G=3 方程(1): 变量个数m1=2, k-m1=3>G-1=2,因而为过度识别. 方程(2): 变量个数m2=2, k-m2=3>G-1=2,因而为过度识别. 方程(3): 为恒等式,无需判别识别状态。 8.6 Yt = Ct + It +Gt +Xt Ct = β0 + β1D t + β2C t-1 + u t Dt = Yt – Tt It = α0 + α1Yt + α2R t-1 +νt (1) 内生变量: Yt , Ct , It ,Dt; 外生变量: Gt, Xt, R t-1 Tt; 前定变量: Gt, Xt, Tt, R t-1,C t-1. (2) 第一步:进行简化式回归,要估计的方程是: Yt = П10+П11 Tt +П12Ct-1 +П13Rt-1 +П14Gt +П15Xt+ν1t Dt = П20+П21 Tt +П22Ct-1 +П23Rt-1 +П24Gt +П25Xt+ν2t ˆ. ˆ , D 分别估计两个方程,得到Yt , Dt的估计值Yttˆ代替方程右端的Yt ,Dt,进行OlS回归, 第二步:在原结构方程中用Yt 、Dt即估计 8.7 (1)本模型中K=10,G=4。不难看出,各方程中“零约束”的数目都大于G-1=3,因而都是过度识别的,宏观经济模型大都如此。 (2)考虑用2SLS方法估计三个行为方程,也可以用3SLS方法或FIML法估计之。 ˆ+ β2C t-1 + u t Ct = β0 + β1Dtˆ + α2R t-1 +νt It = α0 + α1Yt35 / 44 8.8 (1)内生变量:Yt,It,Ct,Qt;外生变量:Rt,Pt;前定变量:Yt-1,Ct-1,Q t-1,Rt,Pt。 (2)模型总变量个数k=9,方程个数G=4 方程(1): 变量个数m1=3, k-m1=6>G-1=3,因而为过度识别; 方程(2): 变量个数m2=3, k-m2=6>G-1=3,因而为过度识别; 方程(3): 变量个数m3=4, k-m3=5 (3)因为原模型中4个方程皆是过度识别,因此不能使用间接最小二乘法。因为间接最小二乘法只适用于恰好识别方程的估计。 (4)第一步:进行简化式回归,要估计的方程是: It =П10+П11 Yt-1+П12 Ct-1+П13 Q t-1+П14 Rt+П15 Pt+ν1t Yt =П20+П21 Yt-1+П22 Ct-1+П23 Q t-1+П24 Rt+П25 Pt+ν2t Qt =П30+П31 Yt-1+П32 Ct-1+П33 Q t-1+П34 Rt+П35 Pt+ν3t ˆ。 ˆI 估计上述方程,得到It、Yt、Qt的估计值t、Yt、Qtˆ代替方程右端的It、Yt、Qt ˆt、Yˆ、Q 第二步:在原结构方程中用I,进行OlStt回归,即估计 ˆt + u 1 t Yt =β0 +β1Yt –1 +β2Iˆ + u 2 t ˆ + α2QIt = α0 + α1YttCt = 0 + 1 ˆ + Yt 2 Ct-1 + 2 3 Pt + u 3 t Qt = 0 + 1Q t-1 + Rt + u 4 t 得到这四个方程结构参数的估计值。 8.9 (1) 内生变量: Ct , It ,Mt Yt ,; 外生变量: Gt, Xt; 前定变量: Gt, Xt, C t-1, I t-1. (2)模型总变量个数k=8,方程个数G=4 方程①: 变量个数m1=3, k-m1=5>G-1=3,因而为过度识别。 方程②: 变量个数m2=3, k-m2=5>G-1=3,因而为过度识别。 方程③: 变量个数m3=2, k-m2=6>G-1=3,因而为过度识别。 (3)第一阶段:计算各行为方程的2SLS估计值; 36 / 44 ① 进行简化式回归,要估计的方程是: Yt = П10+П11 Gt +П12 Xt +П13 Ct-1+П14 It-1 +ν1t ˆ。 估计方程,得到Yt 的估计值Yt② 在原结构方程中用Yt 代替方程右端的Yt ,进行OlS回归,即估计 ˆ+α2Ct-1 + u1t Ct =α0 +α1Ytˆ +β2It –1+ u2t It =β0 +β1YtMt = 0 + ˆ + u3t 1Yt 第二阶段:用这些2SLS估计值计算各结构方程的残差,然后估计各结构方程扰动项的同期方差-协方差矩阵; 第三阶段:用GLS法估计代表该系统所有行为方程的巨型方程。 ① 形成代表该系统所有行为方程的巨型方程; 巨型方程为: Yi0Z1i1Z2i2Z3i0Z4i1Z5i2Z6i0Z7i1Z8iuii=1,2,…,n,n+1,…,2n,2n+1,…,3n 此方程各变量均有3n个观测值,如下所示: ˆYC11C001ˆCC10Ynn1n0I1001 Z=Z= Z= Yi= Z=1i2i3i4i0In001M00010000M0 n37 / 44 0u11000u00001nˆu210I0Y01 Z= Z= Z= U= Z5i=6i7i8iiˆu2n0In1Y0nˆ0Y01u311001uYˆ3nn ② 用GLS法估计代表该系统所有行为方程的巨型方程,得到全部参数的3sls估计值。 8.10 (1)模型总变量个数k=4,方程个数G=3 消费方程: 变量个数m1=2, k-m1=2==G-1=2,因而为恰好识别,可用ILS或2SLS来估计。 (2)A.求简化式方程 将恒等式代入消费函数,得 Ct01(CtIt)u1Ct01Ct1Itu1 (a) 将投资方程代入(a)式,得 Ct01Ct1(a0a1Rtu2)u1 整理,得 Ct01a01a1uu1 该式可写为 Rt12111111Ct12Rtt (b) 式中101a01121a1 11对(b)利用OLS法进行估计,则有 ˆ2(RR)(CC)123 4(RR)tt2tˆ1Cˆ2R553*3 B. 将消费和投资方程代入恒等式,得 38 / 44 Yt01Ytu101Rtu2 经整理得: Yt001uu2 该式可写为 Rt1111111Yt34Rtt (c) 式中3a00114a1 11对(c)利用OLS法进行估计,则有 ˆ4(YtY)(RtR)164 4(RtR)2ˆ3Yˆ4R603*472 C.根据1、2、3、4的公式,可解出0、1。 0123412 4ˆ1、ˆ2、ˆ3、ˆ4,由此可解出消费由于已得到1、2、3、4的估计值函数的结构式系数的估计值如下: ˆˆ10ˆ2ˆ337210ˆ44ˆ23ˆ10.75ˆ44(3)模型总变量个数k=4,方程个数G=3 投资方程: 变量个数m1=2, k-m1=2==G-1=2,因而为恰好识别,可用ILS或2SLS来估计。 8.11 (1)在此模型中,K=4,M1=M2=3,G=2 应用识别的阶条件,两方程都是恰好识别的。 (2)在这种情况下,第一个方程可识别,第二个方程不可识别。 39 / 44 ˆˆ10(3)10ˆ12ˆ12ˆˆ202.4;0.8 12ˆ22ˆ22ˆ21ˆ21ˆˆˆ20ˆ106;21202 ˆ11ˆ11ˆ11ˆ11ˆ21ˆˆ121.8;ˆ22ˆ2221ˆ126 ˆ22ˆ11ˆ11的标准误差。可是从上面可看出,ˆ11是要检验原假设11=0,我们需要简化式系数的非线性函数,要估计它的标准误差着实不易。 第九章 面板数据模型 9.1 表面不相关回归的含义是,所涉及的各个回归似乎不相关,但实际上相关。 各个回归方程分别写出,这使得它们似乎不相关,但是它们有共同点。在本章的例子中,四个回归中的每一个关系到一个不同的制造产业,但它们都会受到宏观经济条件变动(如衰退)的影响。一般来说,影响一个回归的结果的事件也很可能影响其它回归的结果,这个事实表明,表面不相关回归中的各回归之间存在相关。这种相关在数学上表现为扰动项跨方程相关。 表面不相关回归的步骤是: 1.用OLS法分别估计每个方程,计算和保存回归中得到的残差; 2.用这些残差来估计扰动项方差和不同回归方程扰动项之间的协方差; 3.上一步估计的扰动项方差和协方差被用于执行广义最小二乘法,得到各方程系数的估计值。 9.2 有共同截距项的混合数据模型自由度最多,只有一个方程,并且没有虚拟变量。表面不相关回归模型自由度可能是少的,因为每个横截面种类都要有一个回归方程。固定效应模型只用一个方程,因而自由度比表面不相关回归模型多,如果横截面种类很多的话,固定效应模型中会有很多虚拟变量,使得其自由度要显著少于有共同截距项的混合数据模型。随机效应模型用一个方程,并且它是在没有引入虚拟变量的情况下容许截距变动的,因此它的自由度比表面不相关回归模型和固定效应模型都要多。 40 / 44 9.3 当不同的横截面种类的截距之间的差异被认为是固定的而不是随机的情况下,应采用固定效应模型。如果横截面个体是随机地被选择出来以代表一个较大的总体,则采用随机效应模型比较合适。随机效应模型与固定效应模型一样,允许不同横截面种类的截距不同,但这种不同被认为是随机的,而不是固定的。 9.4随机效应模型的扰动项不再满足普通最小二乘法各期扰动项相互的假设,扰动项的一个分量在各期都相同。 9.5 并不总是。尽管将数据合在一起将增加自由度,但有时采用混合数据也是不合适的。如果不同横截面种类的斜率系数不同的话,则最好是分别回归。如果试图通过使用斜率虚拟变量来解决不同横截面种类不同斜率系数的问题,需要假定扰动项方差为常数。而采用分别回归,每个回归的扰动项方差可以不同,也就是每个产业或每个横截面种类的扰动项方差不同。 9.6 不相同。估计值不一样,t统计量也是,可是似乎没有任何明显的差异模式。SUR估计值与OLS估计值之所以不同,是因为表面不相关回归考虑了不同回归的扰动项的相关,而普通最小二乘法分别估计每个方程,不考虑不同回归的扰动项之间的任何相关。 9.7 否。混合数据集的样本容量将为100,可是有50个县市,因此固定效应模型所需要的虚拟变量会消耗太多的自由度。如果你分别运行两个回归,每年一个,每个回归的自由度是44。而运行一个固定效应回归,自由度是45(n-k=100-55,50个虚拟变量,5个常规自变量)。将数据合在一起的主要理由是得到自由度,可是在本题中,此理由不成立。 9.8 问题可通过使用一个F检验来回答,但最容易的方法是采用两年的混合数据估计下面的回归方程: 41 / 44 DVDEXP = β0 +β1INCOME +β2PRICE +β3RAINFALL +β4YEAR2 + u 其中YEAR2=1,若观测值来自第二年的数据;0,其它 回归结果如下: Dependent Variable is DVDEXP Variable Constant INCOME PRICE RAINFALL YEAR2 Coefficient 86.04 0.06 -3.20 7.46 -5.21 Standard Error 24.39 0.01 0.90 2.40 6.59 t-Statistic p-Value 3.53 6.22 -3.57 3.11 -0.79 0.00 0.00 0.00 0.01 0.44 Observations: 24 R2 = 0.79 2 Adjusted R = 0.74 Residual Sum of Squares = 4877.24 F-statistic = 18.18 对β4进行t检验显示,YEAR2统计上不显著,表明不需要固定效应模型。由于仅有两年的数据,因而可以用t检验来替代F检验,检验是否需要固定效应模型。 第十章 定性选择模型 10.1 一般来说,普通最小二乘法不是估计定性选择模型的好方法,这是因为OLS假定因变量和自变量之间存在线性关系,但是对于定性选择模型,二者关系通常不是线性的。具体说来,有以下三个问题: (1)因变量拟合值代表概率,但它们常常小于0或大于1,而概率值是不可能 42 / 44 取这类值的; (2)往往存在异方差性; (3)扰动项不服从正态分布。 10.2 没有问题。两种方法得到的斜率估计值不同是因为估计方法不同。Probit估计是基于累积正态概率分布,而logit估计是基于累积logistic分布。 10.3 一个事件发生的机会是该事件发生的概率除以该事件不发生的概率。如果P是因变量等于1的概率,那么因变量等于1的机会是P/(1-P).。logit模型的拟合值是因变量等于1的机会的自然对数。 10.4 (1) 不是。拟合值0.48的含义是,考虑家庭的收入、孩子的数目以及房价等因素,该家庭将买房的概率估计值为0.48; (2)不会。因为估计的概率小于0.5,因此预测为0。 (3)若该家庭买了房,不会惊讶。因为买房的估计概率接近0.5,0.48仅仅 是估计概率。同时,即便估计值完全正确,它也只是个概率。如果估计概率是0.9,我们预测该家庭将买房,但我们仍有10%的错误机会:该家庭继续租房; 10.5(1)PRICE和CHILDREN不变的情况下,INCOME增加一个单位(1000元),则该家庭将买房的概率增加0.005; INCOME和CHILDREN不变的情况下,PRICE上升一个单位(1000元),则该家庭将买房的概率减少0.008; INCOME和PRICE不变的情况下,该家庭添一个小孩,则该家庭将买房的概率增加0.3。 (2)若采用logit模型,因变量将是ln[HOME/(1-HOME)],每个斜率系数 被解释为对机会的对数的影响。 43 / 44 10.6 (1)86.7%;(2)78.6%;(3)93.8% 10.7 (1)估计方程(10.11),比较CAND1的拟合值和实际值,将大于等于0.5的拟合值记入支持候选人甲(CAND1)的预测值。用全部观测值进行回归,但只用CAND1等于1的观测值来计算预测正确的观测值的百分比,答案是11/14或78.6%. (2)估计方程(10.12),其它步骤与(1)同,答案是7/10或70%. (3)为回答此问题,第一步是找出甲(CAND1)和丙(CAND3)都等于0的所 有观测值。因为所有支持丙的观测值都包含在表10-6中,在表10-1中被省略,因而支持乙(CAND2)的观测值就是在表10-1中甲(CAND1)等于0的观测值。对于这些观测值,逐个检查甲和丙在上面两个回归中的拟合值,对于某观测值,如果CAND1和CAND3的拟合值都小于0.5,则模型预测该选民不支持甲和丙,而必支持乙,该观测值预测正确。如果CAND1或CAND3的拟合值大于等于0.5,则模型预测该选民支持甲或丙,而不支持乙,该观测值预测不正确。答案是12/16或75%. (4)将上面三问中预测正确的观测值数目加在一起,11+7+12=30,即对 30个观测值预测正确,由于观测值总数是30,因此预测正确的观测值的总百分比是75%. 10.8 证: logF(zi)1F(zi)exp(zi)exp(zi)1exp(zi)1exp(zi)loglog exp(zi)1exp(zi)exp(zi)11exp(zi)1exp(zi)exp(zi)1exp(zi)loglogexp(zi)zi11exp(zi) 友情提示:部分文档来自网络整理,供您参考!文档可复制、编制,期待您的好评与关注! 44 / 44
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- 517ttc.cn 版权所有 赣ICP备2024042791号-8
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务