您好,欢迎来到独旅网。
搜索
您的当前位置:首页分析预测区间和置信区间的不同点

分析预测区间和置信区间的不同点

来源:独旅网
§ 一元线性回归模型的置信区间与预测

多元线性回归模型的置信区间问题包括参数估量量的置信区间和被说明变量预测值的置信区间两个方面,在数理统计学中属于区间估量问题。所谓区间估量是研究用未知参数的点估量值(从一组样本观测值算得的)作为近似值的精准程度和误差范围,是一个必需回答的重要问题。

一、参数估量量的置信区间

在前面的课程中,咱们已经明白,线性回归模型的参数估量量是随机变量

^yi的函数,即:ˆky,因此它也是随机变量。在多次重复抽样中,每次

ii1的样本观测值不可能完全相同,因此取得的点估量值也不可能相同。此刻咱们用参数估量量的一个点估量值近似代表参数值,那么,二者的接近程度如何?以多大的概率达到该接近程度?这就要构造参数的一个区间,以点估量值为中心的一个区间(称为置信区间),该区间以必然的概率(称为置信水平)包括该参数。

ˆa,ˆa当中,和如何求得a。 即回答1以何种置信水平位于11在变量的显著性查验中已经明白

tiis^i^~t(nk1)

这确实是说,若是给定置信水平1,从t散布

2表中查得自由度为(n-k-1)的临界值t,那么t值处在t2,t2的概率是1。表示为

P(ttt)122

P(t2iis^i^t)12

P(its^iits^)12^^i2i

于是取得:在(1)的置信水平下i的置信区间是

(its^,its^)2^^i2ii=0,1 ()

在某例子中,若是给定0.01,查表得

t(nk1)t0.005(13)3.0122 ˆ102.3,ˆ0.21,S15,S0.01 从回归计算中取得ˆˆ0101 依照()计算取得0,1的置信区间别离为57.12,147.48和(,) 显然,参数1的置信区间要小。

在实际应用中,咱们固然希望置信水平越高越好,置信区间越小越好。如何才能缩小置信区间?从()式中不难看出:(1)增大样本容量n。在一

样的置信水平下,n越大,从t散布表中查得自由度为(n-k-1)的临界值

t2越小;

同时,增大样本容量,在一样情形下可使估量值的标准差Sˆ减小,因为式中分母的增大是确信的,分子并非必然增大。(2)更要紧的是提高模型的拟合度,以减小残差平方和ei2。假想一种极端情形,若是模型完全拟合样本观测值,残差平方和为0,那么置信区间也为0。(3)提高样本观测值的分散度。在一样情形下,样本观测值越分散,标准差越小。置信水平与置信区间是矛盾的。置信水平越高,在其他情形不变时,临界值

t2越大,置信区间越大。若是要求缩小置信

区间,在其他情形不变时,就必需降低对置信水平的要求。

二、预测值的置信区间

1、点预测

计量经济学模型的一个重要应用是经济预测。关于模型

yi01xiui,i1,2,,n

若是给定样本之外的说明变量的观测值xf,有

yf01xfuf

因xf是前述样本点之外的说明变量值,因此uf和uii1,2,,n是不相关的。引用已有的OLS的估量值,能够取得被说明变量yf的点预测值:

ˆˆxˆfy01f 但是,严格地说,这只是被说明变量的预测值的估

量值,而不是预测值。缘故在于两方面:一是模型中的参数估量量是不确信的,正如上面所说的;二是随机项的阻碍。因此,咱们取得的仅是预测值的一个估量值,预测值仅以某一个置信水平处于以该估量值为中心的一个区间中。于是,又是一个区间估量问题。

2、区间预测

若是已经明白实际的预测值yf,那么预测误差为

ˆf efyfy显然,ef是一随机变量,能够证明

ˆfEefEyfyˆˆxE01xfufE01f 01xf01xf0而



ˆfCovyˆf,yˆfCovyf,yf2Covyf,y2ˆf2Covyf,yˆfuDyˆf,yfyˆfDefCovef,efCovyfy

ˆf由原样本的OLS估量值求得,而yf与原样本不相关,故有: 因为y2ˆf0,Defuˆf Covyf,yDy能够计算出来:

11Dez fnxfxxii1nx22ˆf和ef均服从正态散u 因yˆf构造统计量为: 布,可利用它们的性质构造统计量,求区间预测值。利用yNyˆfˆfEyfyxxf12unn2xixi1ˆfEyfy1nxfx2ˆun2xixi1f~N0,1

22ˆu将u用估量值代入上式,有

tyˆf~tn2

如此,可得显著性水平下Ey的置信区间为

21xfxˆu 式称为yfnn2xixi1ˆft2 yxxf1ˆu2, yˆftnn22xxii1的均值区间预测。

同理,利用ef构造统计量,有

Nefefxx1f12unn2xixi1ˆfyfyxx1f12unn2xixi1~N0,1

22ˆu将u用估量值代入上式,有:

tefef11nxfx2ˆun2xxii1ˆfyfy11nxfx2xxii1n2ˆu~tn2

依照置信区间的原理,得显著性水平下

11xfxˆytf2nn2xixi1()

yf的置信区间:

2ˆuxx12ˆuˆft1nf, yn2xix2i1 上式称为yf的个值区间预测,显然,在一样的下,个值区间要大于均值区间。和也可表述为:yf的均值或个值落在置信区间内的概率为1,1即为预测区间的置信度。或说,当给定说明变量值xf后,只能取得被说明变量yf或其均值Eyf以(1)的置信水平处于某区间的结论。

常常听到如此的说法,“若是给定说明变量值,依照模型就能够够取得被说明变量的预测值为……值”。这种说法是不科学的,也是计量经济学模型无法达到的。若是必然要给出一个具体的预测值,那么它的置信水平那么为0;若是必然要回答说明变量以100%的置信水平处在什么区间中,那么那个区间是∞。

在实际应用中,咱们固然也希望置信水平越高越好,置信区间越小越好,以增加预测的有效意义。如何才能缩小置信区间?从()和式中不难看出:(1)增大样本容量n。在一样的置信水平下,n越大,从t散布表中查得自由度为(n-k-1)

2ˆu的临界值t越小;同时,增大样本容量,在一样情形下可使2e2in2减小,

因为式中分母的增大是确信的,分子并非必然增大。(2)更要紧的是提高模型的拟合优度,以减小残差平方和ei2。假想一种极端情形,若是模型完全拟合样本观测值,残差平方和为0,那么置信区间长度也为0,预测区间确实是一点。(3)提高样本观测值的分散度。在一样情形下,样本观测值越分散,作为分母的xix的值越大,致使区间缩小。置信水平与置信区间是矛盾的。置信水平越高,在其他情形不变时,临界值t越大,置信区间越大。若是要求缩小置

22信区间,在其他情形不变时,就必需降低对置信水平的要求。

四、一元线性回归模型参数估量实例

为了帮忙读者明白得一元线性回归模型参数估量的原理,下面以我国国家财政文教科学卫生事业费支出模型为例,不采纳计量经济学应用软件,用手工计算,进行模型的参数估量。

经分析取得,我国国家财政顶用于文教科学卫生事业费的支出,要紧由国家财政收入决定,二者之间具有线性关系。于是能够成立如下的模型:

EDtFItt

其中,EDt为第t年国家文教科学卫生事业费支出额(亿元),FIt为第t年国家财政收入额(亿元),t,为随机误差项,和为待估量的参数。选取1991—1997年的数据为样本,利用()和()的计算公式,别离计算参数估量值。

表 有关数据表

年份 1991 1992 1993 1994 1995 1996 1997 ED 708 793 958 1278 1467 1704 1904 FI 3149 3483 4349 5218 6242 7408 8651 ..ED -551 -466 -301 19 208 445 5 FI -2351 -2017 -1151 -282 742 1908 3151 ED 734 804 1001 1196 1424 1685 1963 ^EDED -26 -11 -43 82 43 19 -59 ^(EDED)/ED ^有关中间计算结果如下: EDtt8812

FItt38500FItt2t2368694

.tFI·EDt ED1259 FI5500

t078207

FI5612207

FIt.2251194由电脑计算的参数估量值为

ˆ0.24 ˆ39.65, 全数统计结果如下表。

从表中可看出,判定系数R,表示以国家财政收入额来讲明国家文教科学卫生事业费支出额,在1991至1997年间,拟合度相当理想。截距项的估量值对应的t-统计量为,不能通过显著性查验,即不能推翻为0的假设;而一次系数的估量值对应的t-统计量为,不用查表即可知通过显著性查验,即显著不为0,因果关系成立。F-统计量的值为,也表示方程系数显著不为0。

2表一:Eviews计算结果 Dependent Variable: ED Method: Least Squares Date: 09/21/02 Time: 16:22 Sample: 1991 1997 Included observations: 7 Variable C FI R-squared

Adjusted R-squared . of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient Std. Error t-Statistic Prob.

Mean dependent var . dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

表二:不含截距项的Eviews计算结果: Dependent Variable: ED Method: Least Squares Date: 09/21/02 Time: 16:19 Sample: 1991 1997 Included observations: 7 Variable FI

R-squared

Adjusted R-squared . of regression Sum squared resid Log likelihood Coefficient

Std. Error

t-Statistic

Prob.

Mean dependent var . dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

Dependent Variable: LED Method: Least Squares Date: 09/21/02 Time: 16:21 Sample: 1991 1997 Included observations: 7

Variable C LFI R-squared

Adjusted R-squared . of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient Std. Error t-Statistic Prob.

Mean dependent var . dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 多元线性回归模型的参数估量实例

例 成立中国消费模型。依照消费模型的一样形式,选择消费总额为被说明变量,国内生产总值和前一年的消费总额为说明变量,变量之间关系为简单线性关系,选取1981年至1996年统计数据为样本观测值。样本观测值列于表中。

表 中国消费数据表

年份 1981 1982 1983 1984 1985 1986 1987 1988 消费总额 3309 3638 4021 4694 5773 62 7451 9360 国内生产总值 4901 6076 71 8792 10133 11784 14704 前一年消费额 2976 3309 3638 4021 4694 5773 62 7451 年份 19 1990 1991 1992 1993 1994 1995 1996 消费总额 10556 11362 13146 15952 20182 27216 34529 40172 国内生产总值 166 1832 21280 258 34501 47111 59405 68498 前一年消费额 9360 10556 11362 13146 15952 20182 27216 34529 以y代表消费总额,x1代表国内生产总值,x2代表前一年消费总额,应用计量经济分析软件包中一般最小二乘法估量模型,取得以下结果: ^() () ()

2eR0.9997 F28.682 D.W.1.4501 i438613

2^s79.08s0.0149s0.034833739.5   2^^^012yi0.52860.4809x10.1985x2 ()

式中各项都是评判估量结果好坏的重要标准,后面将一一介绍。那个地址仅讨论参数估量值。两个说明变量前的参数估量值别离为和,都为正数,且都处于0与1之间,常数项的估量值也为正,这些参数估量值的经济含义是合理的。随机误差项的方差的估量值为。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- dcrkj.com 版权所有 赣ICP备2024042791号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务