- 相關推薦
面板數據分析方法步驟全解
步驟一:分析數據的平穩(wěn)性(單位根檢驗)
按照正規(guī)程序,面板數據模型在回歸前需檢驗數據的平穩(wěn)性。李子奈曾指出,一些非平穩(wěn)的經濟時間序列往往表現(xiàn)出共同的變化趨勢,而這些序列間本身不一定有直接的關聯(lián),此時,對這些數據進行回歸,盡管有較高的R平方,但其結果是沒有任何實際意義的。這種情況稱為稱為虛假回歸或偽回歸(spurious regression)。他認為平穩(wěn)的真正含義是:一個時間序列剔除了不變的均值(可視為截距)和時間趨勢以后,剩余的序列為零均值,同方差,即白噪聲。因此單位根檢驗時有三種檢驗模式:既有趨勢又有截距、只有截距、以上都無。
因此為了避免偽回歸,確保估計結果的有效性,我們必須對各面板序列的平穩(wěn)性進行檢驗。而檢驗數據平穩(wěn)性最常用的辦法就是單位根檢驗。首先,我們可以先對面板序列繪制時序圖,以粗略觀測時序圖中由各個觀測值描出代表變量的折線是否含有趨勢項和(或)截距項,從而為進一步的單位根檢驗的檢驗模式做準備。
單位根檢驗方法的文獻綜述:在非平穩(wěn)的面板數據漸進過程中,Levin andLin(1993) 很早就發(fā)現(xiàn)這些估計量的極限分布是高斯分布,這些結果也被應用在有異方差的面板數據中,并建立了對面板單位根進行檢驗的早期版本。后來經過Levin et al. (2002)的改進,提出了檢驗面板單位根的LLC 法。Levin et al. (2002) 指出,該方法允許不同截距和時間趨勢,異方差和高階序列相關,適合于中等維度(時間序列介于25~250 之間,截面數介于10~250 之間) 的面板單位根檢驗。Im et al. (1997) 還提出了檢驗面板單位根的IPS 法,但Breitung(2000) 發(fā)現(xiàn)IPS 法對限定性趨勢的設定極為敏感,并提出了面板單位根檢驗的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板單位根檢驗方法。
由上述綜述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5種方法進行面板單位根檢驗。
其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分別指Levin, Lin & Chu t* 統(tǒng)計量、Breitung t 統(tǒng)計量、lm Pesaran & Shin W 統(tǒng)計量、ADF- Fisher Chi-square統(tǒng)計量、PP-Fisher Chi-square統(tǒng)計量、Hadri Z統(tǒng)計量,并且Levin, Lin & Chu t* 統(tǒng)計量、Breitung t統(tǒng)計量的原假設為存在普通的單位根過程,lm Pesaran & Shin W 統(tǒng)計量、ADF- Fisher Chi-square統(tǒng)計量、PP-Fisher Chi-square統(tǒng)計量的原假設為存在有效的單位根過程, Hadri Z統(tǒng)計量的檢驗原假設為不存在普通的單位根過程。
有時,為了方便,只采用兩種面板數據單位根檢驗方法,即相同根單位根檢驗LLC(Levin-Lin-Chu)檢驗和不同根單位根檢驗Fisher-ADF檢驗(注:對普通序列(非面板序列)的單位根檢驗方法則常用ADF檢驗),如果在兩種檢驗中均拒絕存在單位根的原假設則我們說此序列是平穩(wěn)的,反之則不平穩(wěn)。
如果我們以T(trend)代表序列含趨勢項,以I(intercept)代表序列含截距項,T&I代表兩項都含,N(none)代表兩項都不含,那么我們可以基于前面時序圖得出的結論,在單位根檢驗中選擇相應檢驗模式。
但基于時序圖得出的結論畢竟是粗略的,嚴格來說,那些檢驗結構均需一一檢驗。具體操作可以參照李子奈的說法:ADF檢驗是通過三個模型來完成,首先從含有截距和趨勢項的模型開始,再檢驗只含截距項的模型,最后檢驗二者都不含的模型。并且認為,只有三個模型的檢驗結果都不能拒絕原假設時,我們才認為時間序列是非平穩(wěn)的,而只要其中有一個模型的檢驗結果拒絕了零假設,就可認為時間序列是平穩(wěn)的。
此外,單位根檢驗一般是先從水平(level)序列開始檢驗起,如果存在單位根,則對該序列進行一階差分后繼續(xù)檢驗,若仍存在單位根,則進行二階甚至高階差分后檢驗,直至序列平穩(wěn)為止。我們記I(0)為零階單整,I(1)為一階單整,依次類推,I(N)為N階單整。
步驟二:協(xié)整檢驗或模型修正
情況一:如果基于單位根檢驗的結果發(fā)現(xiàn)變量之間是同階單整的,那么我們可以進行協(xié)整檢驗。協(xié)整檢驗是考察變量間長期均衡關系的方法。所謂的協(xié)整是指若兩個或多個非平穩(wěn)的變量序列,其某個線性組合后的序列呈平穩(wěn)性。此時我們稱這些變量序列間有協(xié)整關系存在。因此協(xié)整的要求或前提是同階單整。
但也有如下的寬限說法:如果變量個數多于兩個,即解釋變量個數多于一個,被解釋變量的單整階數不能高于任何一個解釋變量的單整階數。另當解釋變量的單整階數高于被解釋變量的單整階數時,則必須至少有兩個解釋變量的單整階數高于被解釋變量的單整階數。如果只含有兩個解釋變量,則兩個變量的單整階數應該相同。
也就是說,單整階數不同的兩個或以上的非平穩(wěn)序列如果一起進行協(xié)整檢驗,必然有某些低階單整的,即波動相對高階序列的波動甚微弱(有可能波動幅度也不同)的序列,對協(xié)整結果的影響不大,因此包不包含的重要性不大。而相對處于最高階序列,由于其波動較大,對回歸殘差的平穩(wěn)性帶來極大的影響,所以如果協(xié)整是包含有某些高階單整序列的話(但如果所有變量都是階數相同的高階,此時也被稱作同階單整,這樣的話另當別論),一定不能將其納入協(xié)整檢驗。
協(xié)整檢驗方法的文獻綜述:(1)Kao(1999)、Kao and Chiang(2000)利用推廣的DF和ADF檢驗提出了檢驗面板協(xié)整的方法,這種方法零假設是沒有協(xié)整關系,并且利用靜態(tài)面板回歸的殘差來構建統(tǒng)計量。(2)Pedron(1999)在零假設是在動態(tài)多元面板回歸中沒有協(xié)整關系的條件下給出了七種基于殘差的面板協(xié)整檢驗方法。和Kao的方法不同的是,Pedroni的檢驗方法允許異質面板的存在。(3)Larsson et al(2001)發(fā)展了基于Johansen(1995)向量自回歸的似然檢驗的面板協(xié)整檢驗方法,這種檢驗的方法是檢驗變量存在共同的協(xié)整的秩。
我們主要采用的是Pedroni、Kao、Johansen的方法。
通過了協(xié)整檢驗,說明變量之間存在著長期穩(wěn)定的均衡關系,其方程回歸殘差是平穩(wěn)的。因此可以在此基礎上直接對原方程進行回歸,此時的回歸結果是較精確的。
這時,我們或許還想進一步對面板數據做格蘭杰因果檢驗(因果檢驗的前提是變量協(xié)整)。但如果變量之間不是協(xié)整(即非同階單整)的話,是不能進行格蘭杰因果檢驗的,不過此時可以先對數據進行處理。引用張曉峒的原話,“如果y和x不同階,不能做格蘭杰因果檢驗,但可通過差分序列或其他處理得到同階單整序列,并且要看它們此時有無經濟意義。”
下面簡要介紹一下因果檢驗的含義:這里的因果關系是從統(tǒng)計角度而言的,即是通過概率或者分布函數的角度體現(xiàn)出來的:在所有其它事件的發(fā)生情況固定不變的條件下,如果一個事件X的發(fā)生與不發(fā)生對于另一個事件Y的發(fā)生的概率(如果通過事件定義了隨機變量那么也可以說分布函數)有影響,并且這兩個事件在時間上又有先后順序(A前B后),那么我們便可以說X是Y的原因?紤]最簡單的形式,Granger檢驗是運用F-統(tǒng)計量來檢驗X的滯后值是否顯著影響Y(在統(tǒng)計的意義下,且已經綜合考慮了Y的滯后值;如果影響不顯著,那么稱X不是Y的“Granger原因”(Granger cause);如果影響顯著,那么稱X是Y的“Granger原因”。同樣,這也可以用于檢驗Y是X的“原因”,檢驗Y的滯后值是否影響X(已經考慮了X的滯后對X自身的影響)。
Eviews好像沒有在POOL窗口中提供Granger causality test,而只有unit root test和cointegration test。說明Eviews是無法對面板數據序列做格蘭杰檢驗的,格蘭杰檢驗只能針對序列組做。也就是說格蘭杰因果檢驗在Eviews中是針對普通的序列對(pairwise)而言的。你如果想對面板數據中的某些合成序列做因果檢驗的話,不妨先導出相關序列到一個組中(POOL窗口中的Proc/Make Group),再來試試。
情況二:如果如果基于單位根檢驗的結果發(fā)現(xiàn)變量之間是非同階單整的,即面板數據中有些序列平穩(wěn)而有些序列不平穩(wěn),此時不能進行協(xié)整檢驗與直接對原序列進行回歸。但此時也不要著急,我們可以在保持變量經濟意義的前提下,對我們前面提出的模型進行修正,以消除數據不平穩(wěn)對回歸造成的不利影響。如差分某些序列,將基于時間頻度的絕對數據變成時間頻度下的變動數據或增長率數據。此時的研究轉向新的模型,但要保證模型具有經濟意義。因此一般不要對原序列進行二階差分,因為對變動數據或增長率數據再進行差分,我們不好對其冠以經濟解釋。難道你稱其為變動率的變動率?
步驟三:面板模型的選擇與回歸
面板數據模型的選擇通常有三種形式:
Model)。如果從時間上看,不同個體之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那么就可以直接把面板數據混合在一起用普通最小二乘法(OLS)估計參數。一種是固定效應模型(Fixed Effects Regression Model)。如果對于不同的截面或不同的時間序列,模型的截距不同,則可以采用在模型中添加虛擬變量的方法估計回歸參數。一種是隨機效應模型(Random Effects Regression Model)。如果固定效應模型中的截距項包括了截面隨機誤差項和時間隨機誤差項的平均效應,并且這兩個隨機誤差項都服從正態(tài)分布,則固定效應模型就變成了隨機效應模型。
在面板數據模型形式的選擇方法上,我們經常采用F檢驗決定選用混合模型還是固定效應模型,然后用Hausman檢驗確定應該建立隨機效應模型還是固定效應模型。
檢驗完畢后,我們也就知道該選用哪種模型了,然后我們就開始回歸:
在回歸的時候,權數可以選擇按截面加權(cross-section weights)的方式,對于橫截面?zhèn)數大于時序個數的情況更應如此,表示允許不同的截面存在異方差現(xiàn)象。估計方法采用PCSE(Panel Corrected Standard Errors,面板校正標準誤)方法。Beck和Katz(1995)引入的PCSE估計方法是面板數據模型估計方法的一個創(chuàng)新,可以有效的處理復雜的面板誤差結構,如同步相關,異方差,序列相關等,在樣本量不夠大時尤為有用。
【面板數據分析方法步驟全解】相關文章:
銷售數據的分析方法07-25
多維數據分析方法04-07
數據分析常用方法07-26
服裝銷售數據分析方法08-21
數據分析常用方法(熱)07-25
常用數據分析方法有哪些04-04
市場調查數據分析方法12-02
市場調研數據分析方法12-21
關于面向數據流的分析方法04-11
[必備]數據分析常用方法3篇07-25