小样本DW统计量的分布特征论文 篇一
在金融领域的研究中,小样本DW统计量是一个常用的工具,用于检验时间序列数据的自相关性。本文旨在研究小样本DW统计量的分布特征,以帮助研究人员更好地理解和应用该统计量。
首先,我们需要了解小样本DW统计量的定义和计算方法。DW统计量是一种用于检验时间序列数据自相关性的统计量,其计算公式为DW = (sum of squared differences between adjacent residuals) / (sum of squared residuals)。通过计算该统计量,我们可以判断时间序列数据是否存在自相关性。当DW统计量接近于2时,表明数据不存在自相关性;当DW统计量显著偏离2时,表明数据存在自相关性。
然后,我们将对小样本DW统计量的分布特征进行研究。通过模拟实验和统计分析,我们可以得出以下结论:小样本DW统计量的分布呈现出非对称性和偏度。具体来说,当样本量较小时,小样本DW统计量的分布呈现出右偏的特征,即大部分观测值集中在2以下;当样本量增加时,小样本DW统计量的分布逐渐趋于正态分布。
接着,我们将探讨小样本DW统计量的分布特征对实证研究的影响。首先,由于小样本DW统计量的分布呈现出非对称性和偏度,研究人员在进行假设检验时应谨慎解释统计显著性。其次,研究人员在进行回归分析时,应考虑小样本DW统计量的分布特征,以避免对回归系数的估计产生偏差。
最后,我们将讨论如何应对小样本DW统计量的分布特征。首先,可以通过增加样本量来改善小样本DW统计量的分布特征。其次,可以使用其他的自相关性检验方法,如Ljung-Box检验或Durbin-Watson-Rom检验,来辅助判断时间序列数据的自相关性。
综上所述,本文对小样本DW统计量的分布特征进行了研究,并探讨了其对实证研究的影响和应对方法。希望本文的研究结果能够为研究人员提供有益的参考,提高他们对小样本DW统计量的理解和应用能力。
小样本DW统计量的分布特征论文 篇二
随着金融数据的增加和复杂性的提高,小样本DW统计量作为一种常用的工具,被广泛应用于检验时间序列数据的自相关性。然而,关于小样本DW统计量的分布特征的研究仍然相对有限。本文旨在填补这一研究空白,深入研究小样本DW统计量的分布特征,并探讨其在实证研究中的应用。
首先,我们将回顾小样本DW统计量的定义和计算方法。DW统计量是由Durbin和Watson在1950年提出的一种用于检验时间序列数据自相关性的统计量。其计算公式为DW = (sum of squared differences between adjacent residuals) / (sum of squared residuals)。通过计算该统计量,我们可以判断时间序列数据是否存在自相关性。
然后,我们将对小样本DW统计量的分布特征进行深入研究。通过实证分析不同样本量的时间序列数据,我们发现小样本DW统计量的分布呈现出非对称性和偏度的特征。具体来说,当样本量较小时,小样本DW统计量的分布呈现出右偏的特征,即大部分观测值集中在2以下;当样本量增加时,小样本DW统计量的分布逐渐趋于正态分布。此外,我们还发现小样本DW统计量的分布特征受到其他因素的影响,如模型设定和异方差性。
接着,我们将讨论小样本DW统计量的分布特征在实证研究中的应用。首先,我们将探讨如何解释小样本DW统计量的显著性。由于小样本DW统计量的分布呈现出非对称性和偏度,研究人员在进行假设检验时应谨慎解释统计显著性。其次,我们将讨论如何在回归分析中考虑小样本DW统计量的分布特征,以避免对回归系数的估计产生偏差。
最后,我们将提出一些对策来应对小样本DW统计量的分布特征。首先,可以通过增加样本量来改善小样本DW统计量的分布特征。其次,可以使用其他的自相关性检验方法,如Ljung-Box检验或Durbin-Watson-Rom检验,来辅助判断时间序列数据的自相关性。
综上所述,本文对小样本DW统计量的分布特征进行了深入研究,并探讨了其在实证研究中的应用。希望本文的研究结果能够为研究人员提供有益的参考,提高他们对小样本DW统计量的理解和应用能力。
小样本DW统计量的分布特征论文 篇三
小样本DW统计量的分布特征论文
在学习、工作生活中,大家总免不了要接触或使用论文吧,论文是进行各个学术领域研究和描述学术研究成果的一种说理文章。写起论文来就毫无头绪?以下是小编为大家整理的小样本DW统计量的分布特征论文,欢迎大家借鉴与参考,希望对大家有所帮助。
摘要:本文用模特卡罗模拟方法研究了样本容量在54以下的DW统计量的分布特征,并给出小样本DW检验临界值表。同时用DW检验提出了一个判别最小二乘估计中是否存在虚假回归的有效方法。关键词:模特卡罗模拟,DW分布,非平稳性,协整
Distribution of Small Sample DW Statistic
Zhang Xiaotong1 Zhao Chuxiao2
(1. Institute of International Economics, Nankai University, Tianjin 300071)
(2. Management School, Tianjin University, Tianjin 300072)
Abstract In this paper we investigated the DW distribution with sample size under 54 by Monte Carlo simulation method and gave a critical table for small sample DW test. Based on that we proposed a method for recognizing spurious regression in ordinary least squares estimation.Keywords: Monte Carlo simulation, DW distribution, nonstationary, cointegration.
1.概述
八十年代以来,Engle-Granger (1987), Engle-Yoo (1987) 和Sargan-Bhargava (1983)都曾提及用DW统计量检验非平稳变量间的协整性问题。在Sargan-Bhargava (1983)中还专门给出一个DW协整检验用表。但在这些论文中均未对小样本DW统计量的分布特征给与研究。
本文采用蒙特卡罗模拟方法对小样本DW统计量的分布特征进行了充分、详细的研究。样本容量分别取为10,20,30,40和50。变量的设定分为三种情形:一. 所涉及的两个变量都取自I(1)过程;二. 所涉及的两个变量中一个取自I(1)过程,一个取自I(0)过程;三. 所涉及的两个变量都取自I(0)过程。
在有些国家以年为单位的时间序列的最大可观测值个数并不是很大,所以对小样本DW统计量分布特征的研究有着非常重要的理论与现实意义。
本文结构如下。第二节推导两个I(1)变量进行最小二乘回归后,由残差计算的DW统计量的极限分布表达式,第三节介绍蒙特卡罗模拟结果及其分析,第四节给出实例,第五节给出结论。
2.DW统计量的极限分布
给定如下随机数据生成系统,
yt = yt-1 + ut , y1 = 0, (1)
xt = xt-1 + vt , x1 = 0, (2)
其中ut, vt ~ I(0), E(ut) = E(vt) = 0; E(ui uj) = 0, i j," i, j。则yt和xt为相互独立的两个I(1)过程。
建立如下回归模型:
yt = b0 + b1xt + wt . (3)
当对上式进行最小二乘估计时,会产生虚假回归问题。用随机误差wt的最小二乘估计值 构造DW统计量,
(4)
因为当T 时, 必然接近于零,上式中分子为Op(1),而分母T -1sw2也是Op(1),所以DW统计量是Op(T -1)的。当T 时,有
DW 0.
即当用两个I(1)变量进行如模型(3)形式的回归时,DW统计量的极限分布为零。
3.小样本DW分布的蒙特卡罗模拟及其结果分析
当样本为有限样本,特别是小样本时,DW统计量的分布与其极限分布有着很大不同。由于上述条件下的DW统计量的分布无法用解析的方法求解,本文用蒙特卡罗模拟方法对DW统计量的小样本分布特征进行了研究。
以模型(3)为基础,除了以yt,xt ~ I(1)为条件对DW分布(记为DW(1,1))进行模拟外,还分别以yt ~ I(1),xt ~ I(0) 和yt,xt ~ I(0)为条件进行了模拟(分别记为DW(1,0) 和DW(0,0))。
由于DW(0,0)就是通常意义的DW统计量,所以只模拟样本容量T = 10, 40两种情形。对于DW(1,1)和DW(1,0),分别取T = 10, 20, 30, 40和50进行了模拟。在每个样本容量条件下各模拟1000次。所得结果见表一。
首先见表一的第三部分,先分析DW(0,0) 的分布特征。由于DW(0,0) 就是通常意义的DW统计量,所以模拟结果表明,一. DW(0,0)分布的均值为2,不受样本容量大小的影响;二.分布是对称的,相应JB值(表中最后一列)说明小样本DW(0,0)统计量的分布与正态分布相当近似。三. 随着样本容量的增大,分布的标准差逐步减小。
见表一的第一、二部分。小样本DW(1,1)和DW(1,0)统计量有着相似的分布特征。一. 分布均为右偏态,分布左侧有端点,端点为零;二. 随着样本容量的增大,DW(1,1)和DW(1,0)分布的右偏倚程度越来越大,分布均值逐步相左移动,90、95、99百分位数也逐步向左移动,同时分布的标准差逐步减小,分布的峰值越来越大,DW取值向零集中;三. 在样本容量相同的条件下,DW(1,0)分布总是位于DW(1,1)分布的左侧,即DW(1,0)分布的均值、百分位数以及方差都比DW(1,1)分布的相应量小。T = 50模拟1000次的DW(1,1)和DW(1,0)分布的结果分别见图一和图二。
表一 DW分布的蒙特卡罗模拟结果
类 型 样本容量 百 分 位 数 均 值 标准差 偏 度 JB统计量
1 90 95 99
10 0.22 2.18 2.45 2.81 1.28 0.62 0.50 48.74
DW(1,1) 20 0.11 1.28 1.49 1.80 0.75 0.39 0.68 77.61
30 0.09 0.90 1.04 1.39 0.51 0.29 1.07 293.73
40 0.06 0.77 0.88 1.16 0.41 0.25 1.06 250.10
50 0.05 0.59 0.71 0.98 0.33 0.20 1.16 341.31
10 0.18 1.73 2.02 2.38 0.98 0.53 0.73 89.59
20 0.09 1.02 1.21 1.59 0.56 0.34 1.22 369.61
DW(1,0) 30 0.06 0.70 0.83 1.18 0.38 0.24 1.27 430.43
40 0.04 0.54 0.66 0.91 0.30 0.19 1.25 383.68
50 0.04 0.45 0.54 0.71 0.24 0.15 1.12 261.84
DW(0,0) 10 1.31 2.75 2.97 3.24 2.02 0.57 0.00 7.17
40 0.72 2.41 2.53 2.70 2.00 0.31 0.03 4.06
注:1. DW(1,1)表示由两个I(1)变量进行回归,计算得到的DW值。
2. DW(1,0)表示由一个I(1)变量和一个I(0)变量进行回归,计算得到的DW值。
3. DW(0,0)表示由两个I(0)变量进行回归,计算得到的DW值。
4. 在每个样本容量条件下各模拟1000次。
图一 T = 50模拟1000次的DW(1,1)分布直方图 图二 T = 50模拟1000次的DW(1,0)分布直方图
在相同样本容量条件下,DW(1,0)分布之所以位于DW(1,1)分布左侧,可作如下解释。随着T ,DW(1,0)和DW(1,1)的分布都趋近于零。由于DW(1,0)来自于一个I(1) 变量和一个I(0)变量之间的回归,所以残差序列wt ~ I(1)。由于DW(1,1)来自于两个I(1)变量之间的回归,一般来说残差序列wt ~ I(1),但也有可能在yt和xt之间存在协整关系,从而使wt ~ I(0)。所以DW(1,0)分布必位于DW(1,1)分布的左侧。
用DW(1,1)统计量可以检验相应两个I(1)变量yt和xt是否存在协整关系。同时DW(1,1)统计量也可用来判断普通最小二乘回归中是否存在虚假回归。这与协整检验是一致的。若两个I(1)变量存在协整关系,则回归是有意义的,否则为虚假回归。
用表一中关于DW(1,1)的模拟结果,即用表一中第一部分DW(1,1)分布的第90、95、99百分位数,均值和标准差分别对样本容量的到数(1/T)进行回归。结果见表二。
表二 DW(1,1)分布第90、95、99百分位数,均值和标准差分别对1/T的回归函数
(用表一中第一栏相应数据估计)
i 回归函数 R2 s.e. F DW
1 P90 = 0.2561 + 19.4438 (1/T)(6.4) (26.3) 0.9957 0.05 691.2 2.35
2 P95 = 0.3338 + 21.4633 (1/T)(6.7) (23.2) 0.9945 0.06 538.8 2.37
3 P99 = 0.6059 + 22.3828 (1/T)(10.8) (21.5) 0.9936 0.07 462.7 1.45
4 Mean = 0.1182 + 11.7759 (1/T) (4.7) (25.6) 0.9954 0.03 656.1 2.18
5 SD = 0.1167 + 5.1082 (1/T)(8.7) (20.6) 0.9930 0.02 462.3 1.90
注:1. P90 , P95 和P99分别表示DW(1,1)分布的第90、95和99百分位数。
2. Mean和SD分别表示DW(1,1)分布的均值和标准差;1/T表示样本容量的倒数。
3. R2表示拟合优度,s.e. 表示回归函数的标准差。
通过拟合优度R2的值可以看到DW(1,1)分布的第90、95、99百分位数,均值和标准差与1/T高度相关。所以完全有理由以表二中的前三个回归函数作为响应面函数,编制小样本DW检验临界值表(见表三)。表三可用来检验两个原变量是否存在协整关系,同时也就是检验原最小二乘回归式中是否存在严重的虚假回归。如果两个原变量是平稳的或者两个变量都是非平稳的但存在协整关系,则最小二乘回归后用残差计算的DW统计量一定服从均值为2的近似正态的.分布,其第90、95和99百分位数一定会大于表三中所给出的相应临界值。而只有当wt非平稳时,DW统计量的值才会以相应概率小于表三给出的相应临界值。表二中的第4和5回归式表明小样本DW(1,1)分布的均值和标准差都随着样本容量的增大而极有规律地减小。
表三 小样本DW检验临界值表
样本容量 T DW分布
第90百分位数 第95百分位数 第99百分位数
10 2.20 2.48 2.84
14 1.64 1.87 2.20
18 1.34 1.53 1.85
22 1.14 1.31 1.62
26 1.00 1.16 1.47
30 0.90 1.05 1.35
34 0.83 0.97 1.26
38 0.77 0.90 1.19
42 0.72 0.84 1.14
46 0.68 0.80 1.09
50 0.64 0.76 1.05
54 0.62 0.73 1.02
4.实例分析
为研究我国国际贸易与国民经济的关系,以我国进出口贸易总额(Yt,亿元人民币)和社会总产值(Xt,亿元人民币)为变量(数据见中国统计年鉴,1983,第26页和591页,1950-1983)得如下估计模型:
= - 64.4061 + 0.0734 Xt (5)
(-3.2) (17.5)
R2 = 0.91, s.e. = 66.9, DW = 0.27
用DW = 0.27与表三中检验水平为0.05的相应临界值(0.97)相比较,因为0.27 < 0.97,结论是上述回归为虚假回归,模型误差项存在严重的自相关。这种情况下应该对模型进行修正或用其他方法建立与估计该两个变量之间的关系。
下面用单整和协整检验的方法验证虚假回归的存在。经ADF检验,结论是Yt ~ I(2),Xt ~ I(2)。用 表示与上式相应的残差序列。对 进行ADF检验,得ADF = -1.9;对 的一阶差分序列d 进行ADF检验,得ADF = -3.4,所以wt ~ I(1)。这说明Yt和Xt都是二阶非平稳的,且不存在协整关系。则回归式(5)必然为虚假回归。
5.结论
本文对小样本DW统计量的分布特征进行了充分研究。小样本DW统计量的基本分布特征是左侧以零为端点,右侧拖尾。样本越小,DW分布的离散程度越
大,右尾部越“胖”,偏度越小。它与DW统计量的极限分布有着很大不同。当回归函数所涉及的变量为平稳变量或为非平稳变量但存在协整关系时,用最小二乘法得到的估计式才是有意义的。当回归函数所涉及的变量为非平稳变量,且不存在协整关系时,用最小二乘法得到的估计式为虚假回归式。本文用DW统计量提出了一个判别有意义回归和虚假回归的有效方法。参考文献
Engle, R. F. and Granger, C. W. J. (1987), Cointegration and error correction representation,estimation and testing, Econometrica, 55: 251-76.
Engle, R. F. and Yoo, B. S. (1987), Forcasting and testing in cointegrated system, Journal of Econometrics, 35: 143-59.
Fuller, W. A. (1976), Introduction to statistical time series, John Wiley, New York.
MacKinnon, J. G. (1991), Critical values for co-integration test, in R. F. Engle and C. W. Granger(eds), Long-run Economic Relationships, Oxford University Press, 267-76.
Sagran, J. T. and Bhargava, A. (1983), Testing residuals from least squares regression for being generated by the Gaussian random walk, Econometrica, 51: 153-74.
Phillips, P. C. B. (1986), Understanding spurious regression in econometrics, Journal of Econometrics, 33: 311-40.