一個完整的實證分析框架:從數據、模型到結果檢驗
來源:指數網  日期:2019-09-11
    • 分享到QQ空間

隨著中國經濟市場化改革的深化,經濟學教育也發生了翻天覆地的變化。在不到20年的時間內,伴隨著一大批從西方留學歸來經濟學者的努力推廣,西方經濟學已經被完整地介紹到了中國,現代西方經濟學的理論框架和分析工具,也已經成為了政府經濟政策的主要參考依據。中國學者對經濟學的研究,也逐步與世界接軌。

跟隨世界主流經濟學的研究范式,數量化研究已經成為了中國經濟研究的主流。經濟學,作為社會科學中數量化程度非常高的一門學科,其本身還是脫離不了社會科學本身的限制。經濟本身是一個復雜系統,各種變量——可觀察的以及不可觀察的變量,錯綜復雜,這限制了經濟學科學化,使經濟學對社會經濟發展的預測幾乎不可能。經濟學的主要使命是幫助人們認識復雜的經濟世界,更多時候是對經濟現象提出合理解釋。

一篇嚴謹的經濟學論文,一般需要3個基本的要素:視點、參照系以及分析方法。視點為論文所要論證的觀點;參照系為大家理解經濟現實提供了一些基本的比較標尺;而只有分析工具才能夠真正幫助人們深入分析紛繁復雜的經濟世界,分析工具也通常被稱之為“經濟學模型”。

模型是對現實世界的一種抽象。由于經濟現象本身的復雜性,在實際分析中,需要剝離一些對關注的現象無足輕重的變量,抽象出關鍵變量,根據一些基本或者顯而易見的假設,分析這些變量之間的關系,得出一些通常出人意料,但又合理,并且對人們了解現實具有幫助的結論。很多經濟學的重要結論并不是顯而易見;如果顯而易見,那也不需要經濟學這門學科。例如,貿易理論中非常重要的比較優勢模型,對一些訓練有素的經濟學家來說是非常簡單的結論;但對普通大眾來說,卻有可能顯得異常高深而難以理解。

支撐現代經濟學分析框架就是模型。經濟模型在一篇經濟學論文中,發揮核心的作用,模型的結構和正確應用,對文章的觀點穩健與否,正確與否發揮決定性支撐作用。經濟學模型可以是描述性模型,也可以是數量化模型。前者雖非主流,但也不能否定其存在。一個典型代表即為科斯定理。而后者則為現代經濟學的主流,在主流經濟學期刊和教科書大行其道。非數量化模型的學術論文,已經很難在主流經濟學期刊占有一席之地。因為經濟學數量化的優勢在于能夠容易檢驗結論的穩健性和邏輯結構。如果一個經濟學結論不合理,數量化的模型可以比較容易檢查其出錯原因:是假設的問題,還是論證過程的問題。

經濟學數量化模型大體可以分為數理模型和計量經濟模型。數理模型從一些簡單并且顯而易見的現實假設出發,通過理性經濟人假設等機制,得出一些有助于人們理解經濟現實且通常出人意料的結論,這屬于現代理論經濟學的主流研究范疇。計量經濟模型是結合了經濟學理論和統計學方法對經濟現象進行定量分析的方法,這是現代經濟學實證分析的主要手法,可以具體得出一些現實變量之間的實證關系。

Pfleiderer提出,如果不注重經濟學理論模型的假設條件,很有可能導致理論模型結果不穩健,產生“變色龍”一樣的結果,這樣的現象也同樣存在于實證計量經濟模型分析中,由于計量經濟模型的概率基礎,“變色龍”現象在實證模型中可能尤甚。無論是數理模型,還是計量模型,都屬于模型的范疇。模型有一些共同的結構特性。不遵守模型的規則,濫用模型,會導致分析結果缺少穩健性、合理性和可靠性。Pfleiderer已經對現有理論經濟學模型中的“變色龍”問題作了一個非常詳細的總結,所以本文主要對應用計量模型在實證分析中存在的問題作一個總結。

實證分析是計量模型和數據的一個有機結合。理論計量經濟學主要關注于開發適用于現實經濟分析的計量經濟學模型,是一門嚴謹的科學。而應用計量經濟學是應用計量經濟模型和數據結合來分析實際中的經濟問題。一個好的值得信賴的實證分析,需要注意的操作問題非常多而且瑣碎,甚至比理論模型存在的問題更麻煩。

本文試圖提供一個應用計量模型進行實證分析的框架,這個框架試圖包含實證分析的主要問題。接下來首先論述一般模型的結構特征,然后再從計量經濟分析的數據特征、計量模型結構以及參數穩健性等角度,來分析如何才能得出一個合理且值得信賴的實證結果。

二、經濟模型的結構

所有模型(不僅是經濟模型)的結構包括3個部分:環境、機制以及求解過程。

(一)環境

所謂環境,即為模型的假設條件。任何模型都有一定的適用環境。例如要在長江上建一座大橋,首先需要建一個模型。長江上游和下游的環境顯然不一樣:水流、運輸以及地質條件存在很大的差異。如果不考慮這些條件,直接把上游大橋的模型移植到下游,其結果必然造成很大損失。

同樣,任何一個經濟模型,也有其適用環境。即每個經濟模型都存在一些嚴格的假設條件。這些假設條件可能是顯性的,也可能是隱含的。經濟學家的一個主要任務就是要發現模型中的假設條件,放寬或者改變這些假設條件,然后分析其可能的后果。經濟學理論的每一次突破,基本上都是改變這些假設條件造成的。不注重經濟模型假設的后果是非常嚴重的,有可能導致論文的結論像“變色龍”一樣,從而使文章失去嚴謹性。

應用計量模型進行實證分析,其假設條件更加復雜苛刻。一方面,實證分析所參照的經濟理論存在一些假設條件;同時,計量模型本身也存在一些假設。忽視前者的假設條件,通常會導致實證結果無法解釋,或者存在偏差。忽視后者的假設條件,使計量模型的參數估計存在偏差。這兩方面的例子在實證分析中不勝枚舉。

經濟學研究的初學者,通常會把國際權威學術雜志上分析一國(通常為美國)的經濟模型應用到另一國(通常為中國)中去。國家之間經濟、政治以及文化背景可能存在很大差異。如果不了解這些差異,會導致模型出現適用偏差,或者實證結果的解釋出現很大錯誤。例如,現有的實證研究發現在美國歐洲等發達國家,肥胖和教育存在顯著的負相關。這樣的結果很好理解:良好教育的人很注重自己的健康與形象。但是,一些學者對印尼和越南等亞洲發展中國家的研究卻發現肥胖和教育存在顯著的正相關。這樣的結果使某些西方學者的解釋出現了錯誤。按照西方的邏輯,為了減少肥胖,難道要降低教育水準?這樣的結果差異其實是出于文化的差異。因為在印尼、越南等亞洲發展中國,肥胖通常是顯示一種社會地位。按照中國的俗話,這是一種“富態”。不了解這樣的隱含假設,文章結果的解釋可能會出現一些低級錯誤

計量經濟模型本身也存在一些固有的假設,這些假設條件必須在實證分析時小心檢查。例如,最常用的最小二乘法(OLS),一般存在5個基本假設。這些假設包括:(1)模型是線形的;(2)不存在多重共線性;(3)自變量和誤差項之間不相關;(4)誤差項同方差,并且誤差項之間不相關;(5)誤差項服從正態分布*。對于這5個假設條件,每一個條件都至關重要,保證了最小二乘法結果的存在性、一致性、有效性以及可檢驗性。一個嚴謹的應用最小二乘法的實證分析,必須要對這5個條件逐一檢查或者檢驗。如果檢驗拒絕了這些假設條件,必須要校正模型。例如,如果變量關系不是線性的,就要采用非線性的模型。如果自變量和誤差項之間不相關(自變量外生性)的假設被拒絕,即模型存在所謂的內生性問題,工具變量方法就成為了一個可行的解決方案。

(二)機制

一旦有了假設環境,就要識別出模型中的關鍵變量,找出這些變量之間的關系,這就是模型的機制問題。例如,最小二乘法中的機制就是估計系數使誤差項的平方和最小。

在實證模型中,有些人喜歡非常復雜的模型,喜歡包含盡量多的變量在計量模型中。包含無關的冗余變量在模型中,在樣本有限的情況下,可能導致模型的效率下降,使估計結果顯得不穩定;在解釋結果時也會造成不必要的困難。在另外一些情況下,例如模型為非線性,包含太多的變量,或者使用過分復雜的機制,可能會導致模型無解。相反,如果丟失一個關鍵變量,有可能造成模型的內生性問題,使模型的估計結果不能滿足一致性要求。

一個好的經濟模型不是以復雜程度來衡量;只要能夠說明問題的模型都是好模型。通常情況下,“簡單最好”原則是模型的選擇。

(三)求解

最后,在確定模型假設條件和機制確定后,求解模型就成了水到渠成的問題。在實證分析中,模型的解就是所謂的模型參數估計。

作為一個訓練有素的經濟學者,應該對計量模型的參數估計有一個合理范圍的猜測。模型的參數估計在這個范圍內才顯得有道理。如果一個計量模型的估計結果不合理,必須要回頭檢查數據,或者模型的假設以及機制,來確認為什么會出現違背經濟學常識的現象。

三、經濟數據的特征

實證分析是經濟計量模型和數據的一個結合。一個好的實證論文首先需要好的數據支撐。對于實證所需數據,要注意3個問題:數據的真實性、數據來源以及數據的種類。數據的真實性和數據來源緊密相關,數據的真實性決定分析結果的穩健性,而數據的種類通常會決定具體的模型選擇。

(一)數據的真實性

數據的真實性與數據的來源密切相關。用來進行經濟分析的數據,數據的真實性出現扭曲是很正常的現象。數據本身不會說謊,會說謊的是人。造成這些扭曲的原因非常復雜,可能是數據收集者或者提供者無意造成的測量誤差(例如,在家庭調查中,被調查者對自己的年收入通常沒有很準確的記錄,只是通過記憶給出一個大體的數字);也可能是他們故意的扭曲(例如,在家庭調研中,有些富裕的被調查者不愿意告訴別人真實的收入,害怕惹麻煩)。如果數據本身出現了問題,分析結果出現偏差,那就毫不意外。

數據的扭曲,大體上可分為:測量誤差和樣本選擇。

1.測量誤差

測量誤差對實證結果造成的扭曲在理論計量經濟學中已經得到了充分研究。Deaton提出,在最小二乘法中,如果只有一個自變量存在非系統性測量誤差那它的回歸系數的絕對值會比真實值小,這稱之為“測量誤差的鐵律”,但是如果多個變量存在非系統性測量誤差,那回歸系數的扭曲方向沒有一定的規律。但是,如果測量誤差是系統性的,那會造成模型的內生性問題。何謂系統性誤差?在這里指誤差項和自變量存在相關關系。這需要用工具變量方法來解決。

2.樣本選擇

樣本選擇就是某些樣本由于某些外在的系統性原因,導致觀察值丟失。一個典型的例子:在調查居民工資收入時,某些居民可能由于市場工資低于自己的保留工資水平而選擇不工作,導致這部分居民的工資收入無法觀察。顯然,他們有自己的市場工資水平,這個工資不會等于零。如果以零作為他們的工資,這顯然是不對的;如果去除這部分樣本,也會導致回歸模型的系數產生和真實值不一致的問題。Heckman解決了這個問題,并因此在2000年獲得諾貝爾經濟學獎。

(二)數據來源

經濟數據一般有3個來源,具體為調研數據、政府等機構的統計數據以及實驗數據等。

1.調研數據

在研究居民微觀經濟問題時(例如,消費、投資以及儲蓄等行為),研究者或者政府等機構通常會搜集微觀調研數據。Deaton對調研數據的實證分析的方法作了一個很好的總結。

在調研數據中,由于被調查對象的認知有限(例如,被受訪者由于記憶的限制,無法準確提供一年內家庭收入、消費以及投資數量),或者調查者在填寫數據時發生筆誤(例如,調查者在填寫調查表時,不小心把男性填成女性,或者把年齡15歲聽成75歲等),會造成一些非系統性誤差。在數據處理時,可以運用一些統計工具把一些異常值去除。如果不加以處理,在樣本較小時,這樣的誤差可能給回歸系數帶來很大的偏差。

比較棘手的是調研數據中的系統性誤差。一個很好的例子就是國家統計局的農村住戶調查統計和城鎮居民住戶調查統計中,由于富人拒訪率過高,使富人的樣本代表性過低以及富人的真實收入報告值低于真實值。富人的樣本過低屬于上述的“樣本選擇”問題;富人的真實收入等報告值過低,這屬于上述的“系統性測量誤差”。這些低報的灰色收入,可能導致計算的儲蓄率以及GINI系數等一系列經濟指標偏低。這些誤差給計量模型的回歸結果帶來的誤差通常也是非常嚴重的。

在信息時代,網絡提供了一種便捷的調研手法。但是很顯然,網絡調研也存在很嚴重的樣本選擇問題。在現階段,不是所有的人都可以接觸互聯網,那些沒有接觸網絡的人就被過濾掉了。

如今已經進入了一個大數據的年代。由于現代計算機技術的發展,可以存儲海量的數據。“大數據”可以幫助研究者減少因為樣本選擇造成的誤差,有助于更準確研究消費者行為。但是,這些大數據很多時候與一些商業目的相聯,這就激勵了大數據的造假。例如,某些手機企業為了增加市場影響力,在網絡銷售中可能會發生銷售給自己代理人的行為,從而達到影響消費者的目的。

有些系統性誤差可以通過一些統計或者計量方法(例如用工具變量、加權回歸或者Heckman樣本選擇處理方法)來解決;而另外一些系統性誤差卻可能因為造成誤差的信息不明確而根本無法解決(例如根本沒有被選擇去掉的樣本信息),甚至研究者根本就無法意識到這些誤差的存在。

對于調研數據,一個值得關注的問題就是數據的“簇效應”。一般而言,為了避免調研數據的樣本選擇誤差,通常會采用分層抽樣辦法(例如在農戶調研中,通常是每村或者每個社區都要有代表性樣本)。但是,分層抽樣也造成了所謂的“簇效應”。在計量分析中,“簇效應”會導致計量模型的回歸系數和方差混合了簇間效果和簇內效果,必須要用“簇效應”糾正方差,或者采用穩健性的標準誤差。否則,這會對回歸系數的顯著性檢驗造成很大的影響。

2.統計和行政管理數據

數據的另一個主要來源為政府等機構提供的統計和行政數據。很多研究者認為,政府的數據具有很強的權威性,所以在研究中受到廣泛采用。在實證分析中,由于數據來源的便利性,廣受研究者青睞的一種分析方法是用省級的面板統計數據。

很可惜,中國政府的統計數據一直以來廣受質疑。其中最受關注也最受廣大研究者質疑的一個基礎統計變量為GDP。長期以來,GDP與官員的政績密切關聯,所以GDP被人為扭曲是一個在所難免的現象。在中國統計數據報告中,通常發現省級GDP總和遠遠大于國家層面GDP總和。

不僅是GDP,中國的許多統計變量存在扭曲的現象。具體到農業統計數據,一個奇怪的現象是中國的耕地面積統計一直在增加:1997年前的15億畝,增加到1997年的18億畝。而最近的第二次全國土地調查顯示,中國有耕地20.27億畝。這么一個關鍵的統計數據都不準確,這對經濟分析和政策決定會造成重大傷害。

中國的很多農產品的生產量遠遠大于消費量。Yu(2014)對中國的豬肉統計作了一個系統性的分析,發現統計誤差由很多原因造成的,包括生產的虛報、消費的低報以及肉類加工中的損失等原因,其中最主要的原因還是生產的虛報,超過了誤差的50%Yu等同時也指出,中國的統計系統在改革開放初建立,已經很難適應現代的高度市場化的經濟體系,必須要對現有的統計體系作重大的改革。

這種系統性誤差,不言而喻,對實證結果的影響是巨大的。但是,現有的實證文獻很少對這樣誤差造成的影響作分析、討論以及糾正,基于這些實證基礎上的政策建議的基礎都不是穩健的。

基于以上分析,本文建議那些運用政府統計數據進行的實證分析,都應該重視這種系統性誤差,運用工具變量等方法來檢驗和糾正計量結果的誤差是一種通常的手法。如果無法糾正,對誤差造成的可能后果作一個討論是必要的。

3.實驗數據

由于傳統的經濟分析在某些實證分析中無法克服內生性問題,實驗經濟學便大行其道。實驗經濟學分為田野實驗、實驗室實驗以及自然實驗。

實驗經濟學最重要的關注點是實驗的設計(如樣本是否隨機),而數據的誤差本身很少受質疑。但是,發生刪改和捏造數據,那是另當別論。

調研數據和統計數據一般是由隨機產生機制產生;而實驗數據本身是非隨機的。這個區別本身不會影響計量模型估計的一致性和效率。相對于調研數據和統計數據,由于成本的限制,實驗數據一個重大缺陷是實驗樣本通常不會很大。所以在計量分析實驗數據時,必須要注意小樣本對計量結果造成的影響。在遇到小樣本的時候,“自助法”產生標準誤差是一個通常的選擇;此外,運用Bell-McCaffrey手法得出穩健的標準差也是一個可行的方法。

(三)數據類型

數據類型可以分為:截面數據、面板數據以及時間序列數據。每一類數據有自己的優勢,也有自己的劣勢。數據的類型,通常決定計量模型的選擇。

1.截面數據

截面數據由于收集的時間成本比較低,在經濟分析中是一種常見的數據類型,它主要應用在微觀經濟行為的分析中,雖然在一些宏觀政策分析中也偶有應用。

由于數據結構本身的限制,在計量分析中,隱含著一個假設條件是每一個經濟主體的未觀測到變量(即誤差項)不存在系統性差異。但是,這樣的假設條件有時過于強烈,而且在實證分析中也無法檢驗該假設。這有可能會導致一些實證分析產生不切實際的結果。

Stock等在其流行的計量經濟學教科書的第八章中有一個經典例子:運用美國各州的截面數據發現啤酒稅的高低和交通事故率之間存在奇怪的正相關關系。但是,運用固定效應模型的面板數據后,這個相關關系變成了顯著的負相關。這是因為各州對酒駕的態度不一樣,截面數據模型無法控制這個變量,而導致了內生性問題;而面板數據能夠通過控制州的效果而去除這個變量的影響。這顯示了面板數據的優勢。

2.面板數據

相對于截面數據,面板數據可以控制觀測主體的未觀測到的變量,使模型的估計變量滿足一致性要求。此外,在實證分析中,很多研究者也偏好于使用滯后變量作為工具變量來克服模型的內生性問題。

在對中國的實證分析中,最廣泛應用的面板數據為省級的統計數據。對以家庭住戶為調查對象的面板數據收集,雖然需要很多的人力和財力,但是隨著信息科技的發展以及政府等部門的大力支持,需要長時間追蹤的以家庭住戶為對象的大規模面板數據的收集在中國也變為可能。關于中國的微觀調研數據,除了不開放利用的國家統計局的農村住戶調查統計數據和城鎮住戶調查統計數據,在學術界廣為使用的數據包括,農業部農村經濟研究中心的“固定觀察點數據”、美國北卡大學的中國健康與營養調查,以及北京大學的中國健康與養老追蹤調查。

對于面板數據的處理,除了不常見的差分法,比較常見的計量模型包括固定效應模型和隨機效應模型。在本文開始就指出,每一個模型都有不同的假設條件。二者的假設條件區別在于隨機模型必須滿足觀測對象的固定效果變量和自變量之間不相關,而固定效果卻沒有這樣的限制。他們之間的差異可以用Hausman檢驗來識別。

從實際操作的角度來說,固定效應模型在任何時候都保證了一致性,所以固定效應模型雖然損失了一部分效率,但更加穩健,所以在實證分析中占主導地位。除非是某些出現極端的情況:截面數量遠遠大于時間長短,使用隨機效應才可以顯著提高效率。

在實證分析中,還要注意面板數據中的截面數量(N)和時間長短(T)之間的關系。在TN的場合,面板數據更多展現出時間序列的特征。一些時間序列的分析方法有必要導入進來。

最后,在現實中平衡的面板數據比較少見,更多存在的是不平衡的面板數據,不平衡的面板數據在實際計量處理中和平衡的面板數據沒有什么本質的不同。

3.時間序列

隨著現代市場交易頻率不斷增加,為實證研究提供了更多的大樣本長時間序列數據。時間序列分析中最大的問題是數據的平穩性。如果數據是平穩的,最小二乘法模型基本特征可以移植到時間序列里,通常的分析模型包括ARMAVARGARCH等模型。

如果數據不是平穩的,情況就變得非常復雜,回歸系數的標準差有時不服從標準正態分布,從而造成了所謂的偽回歸問題,系數的顯著性加大,原假設更容易被拒絕。

為了校正回歸系數的分布問題,在采用VAR模型作Granger因果分析的時候,即使采用差分的辦法去除非平穩性,其回歸系數的分布也可能不是標準正態分布。通常的方法是對水平變量VAR在用AIC或者BIC基準選擇最優滯后項的基礎上,繼續增加滯后項的方法來得到一致的檢驗結果,增加的滯后項的數量為非平穩變量的最高整合階數。

但是,如果非平穩變量之間存在協整關系,回歸系數是超級一致的。所以,必須先識別計量模型變量之間是否存在協整。協整檢驗的方法包括原始的EngelGranger方法和Johansen秩檢驗和特征值檢驗等方法。Engel-Granger方法比較直觀,但缺點是只能識別是否存在協整,不能識別在多變量情況下的多個協整;Johansen檢驗能夠識別多變量情況下的復數協整個數,所以在實證中廣為使用,但缺點是檢驗通常不夠穩健。

檢驗時間序列數據是否平穩的檢驗方法很多。比較著名的檢驗包括Augmented Dickey-Fuller檢驗、Phillips-Perron檢驗以及KPSS檢驗等。前兩者主要檢驗時間序列是否存在單位根,其原假設是存在單位根;KPSS檢驗的原假設是時間序列是平穩的。在實證中,最好能夠同時報告Augmented Dickey-Fuller檢驗(或者Phillips-Perron檢驗)KPSS檢驗,從不同的兩方面來驗證檢驗結果的穩健性。

最后,時間序列的滯后項數對回歸或者檢驗的結果影響很大。選擇科學合理的滯后項數就顯得至關重要。實證分析中,通常選擇滯后項的方法為Akaike信息準則和貝葉斯信息準則。這兩個準則的原理是基于數據本身對模型的吻合性,加上一個對滯后變量數量的懲罰因子。AIC或者BIC的最小者為最好之模型。

四、計量模型與統計實驗

計量經濟學是結合了經濟學理論和統計學的一門學科。不可否認,計量經濟學的基礎是統計學,但是和統計學還是有本質的區別。計量經濟學更偏重于模型的估計,實證的計量經濟分析需要經濟學理論模型作為基礎,而統計學更偏重于發掘數據之間相互關系,而對他們之間的理論基礎不太重視。

正是計量經濟學和統計學之間的差異,導致了實證分析在現實中遇到了很多難點,而有些問題直到現在還沒有從理論上得到根本的解決。計量分析中有3個問題尤其值得重視。這3個問題為:外生性、偽回歸以及經濟學上的顯著性。

(一)外生性

計量經濟模型作為一個模型必然存在假設條件。為了使回歸結果有效,必須要保證計量模型中的自變量為外生的假設條件。如果變量是內生的,這會導致估計結果不能滿足參數一致性條件。

1.一致性和效率性

參數的估計值結果只是一個隨機變量,不是參數的真實值。從理論計量經濟學的角度出發,判斷一個參數回歸估計是否為“好”的估計的標準有兩個:一致性和效率性。另外一個標準是無偏性,但是無偏性在實際操作中顯得無關重要。一些參數估計可能是有偏的,但還是滿足一致性的條件。

一致性是參數估計的最核心基準。一致性是指當樣本趨向于無窮大時,估計值收斂于參數的真實值。只要估計滿足一致性,就可以增加樣本的數量,得到比較接近真實值的估計。效率性是指一個估計值的反差在所有可能的估計值中最小。

一致性和效率性有時會發生沖突。例如在面板數據的回歸中,固定效應模型一定是一致的估計,而隨機效應模型卻是更有效率的估計。另一個例子就是在有效工具變量回歸中,工具變量回歸滿足一致性;而最小二乘法卻是更有效率的估計。在這兩者發生沖突的時候,傾向于優先滿足一致性。這也是Hausman檢驗的理論基礎。

2.內生性產生的原因

經濟學中最困難的問題就是變量外生性的檢驗。在經濟學理論中,外生變量為獨立于經濟模型系統,在系統外發生變動的變量。而計量經濟學中的外生性是指自變量和模型的誤差項之間不存在相關性。外生性相對應的一個概念就是內生性:自變量和模型的誤差項之間存在相關性。內生性問題會造成模型參數估計不滿足一致性的嚴重后果。內生性問題是計量經濟學中的重點與難點,各主要教科書對此都有著墨。

Stock(2007)提出造成內生性原因包括:(1)相關變量的丟失;(2)方程形式錯誤(把非線性方程設定為線性方程);(3)變量中存在系統性測量誤差;(4)樣本選擇;(5)聯立因果關系;(6)誤差項之間存在相關性。為了保證回歸結果穩健、合理以及可靠,這些問題在實證分析中必須要認真檢查。

外生性假設對經濟模型的估計結果衍生出來的政策建議具有至關重要的作用。只有滿足了外生性假設的估計結果,才能對現實政策分析有意義。否則,只能解釋為變量之間存在相關關系,而不能給出政策建議。

如果對變量的外生性存在懷疑,可以用工具變量回歸方法來檢驗和校正,但前提是工具變量是有效的。

3.工具變量的選擇

工具變量回歸方法中最重要的問題是工具變量的選擇。從廣義的角度來講,最小二乘法就是用變量做自己的工具變量。Imbens(2014)對工具變量的選擇有一個精彩的綜述。工具變量的選擇標準為:工具變量和內生變量相關,但和誤差項不相關。

在實證分析中,工具變量的選擇需要非常小心。首先要運用經濟學理論來尋找工具變量,這可以從自然、歷史或者制度安排的角度出發,發現一些變量會影響內生變量,但是不會直接影響應變量。除此之外,在實際操作中選擇工具變量的手法有兩個簡單方法:(1)如果數據存在“簇效應”,可以用“簇效應工具變量”;(2)如果數據是面板數據,可以用內生變量的滯后期變量作為工具變量。值得指出的是,這兩種方法存在很強的假設:簇效應和滯后變量必須和誤差項不存在相關,這個假設很多時候可能不滿足。在選擇工具變量時,對工具變量的有效性的解釋和檢驗就顯得非常重要。

Stock等與Cameron等對工具變量的有效性作了詳細的論述。對于工具變量的具體選擇,要注意3個問題:

(1)弱工具變量問題:內生變量和工具變量之間相關性不強。這會使工具變量模型產生沒有意義的的估計結果,甚至比不使用工具變量的結果還要差。如果只有一個內生變量,通常采用的方法用內生變量作為應變量和所有的外生變量以及工具變量進行回歸,然后對工具變量進行聯合檢驗,強工具變量的一般檢驗標準為聯合檢驗的F值大于10

(2)過度識別問題:所有工具變量必須是外生的。首先,如果工具變量數小于內生變量數,工具變量模型是無法識別的;如果工具變量數等于內生變量數,工具變量回歸模型是正好識別的;如果工具變量數超過內生變量數,才可以檢驗工具變量模型是否被過度識別?通常采用J統計值或者Sargan來檢驗工具變量是否存在過度識別。只有存在過度識別的時候,所有工具變量才是外生的。值得注意的是,過度識別檢驗的原假設為“模型過度識別”,如果拒絕了原假設,可能至少存在一個工具變量為內生的。

(3)工具變量的冗余問題:工具變量中可能存在多余的無關重要的變量。冗余的工具變量會讓估計結果損失效率。在弱工具變量檢驗中,是否存在一些工具變量的回歸系數的t檢驗不顯著。如果不顯著,他們可能就是冗余的。

在找到有效的工具變量后,可以用工具變量法估計參數。很顯然,有效的工具變量法估計出的參數是滿足一致性,而非工具變量法估計的參數卻是更有效率的。可以再次運用Hausman檢驗來比較他們之間的差異。如果兩者不存在顯著性差異,應選擇非工具變量法;如果兩者之間存在顯著差異,就要依賴于工具變量的估計結果。

4.實驗經濟學和干預效果的估計

在實證分析中,工具變量的上述兩個標準通常難以滿足,所以一些重要的研究課題,在現實中根本無法深入定量研究。一個最典型的例子就是GDP和環境污染之間的關系,無法找到一個工具變量與GDP相關而與環境污染無關;也無法找到一個變量與環境污染相關,而與GDP無關。雖然環境Kuznets曲線提供了GDP和環境污染之間的一個定量關系,但由于無法識別他們之間的因果關系,結論最多就是他們之間存在顯著相關關系,這樣的結果并不能提供很好的政策依據。另外一個有意思的研究課題為信息技術的發展和經濟發展之間的因果關系,也很難做計量分析。

這就需要應用實驗經濟學的方法來解決內生性的問題。實驗經濟學通過人為隨機干預使某些變量外生。關于對干預效果的估計,Wooldridge提供了一個很好的計量方法的綜述。

在這里強調的是有些干預看起來是外生的,其實不然:(1)如果干預真是外生且隨機的情況,最小二乘法的估計結果是有效的;(2)如果干預只和某些可觀測的自變量相關,這時需要運用傾向評分匹配方法來得出滿足一致性的干預估計結果;(3)如果干預變量和某些不可觀測變量相關,或者干預是內生的情況下,還需要使用工具變量的計量方法來估計干預的效果。

(二)偽回歸

在計量經濟的實證研究中,經常會存在偽回歸的問題。所謂偽回歸問題,就是本來沒有關系的兩個變量,或者沒有顯著關聯的兩個變量,在計量經濟模型中卻顯示出了顯著的相關性。這有可能是計量模型設定的問題,或者是計量經濟模型本身特征造成的問題。

1.經濟學理論和偽回歸

如上所述,計量經濟學是結合了經濟學理論和統計學的一門理論。如果計量經濟學模型離開了經濟學理論,把不相關的變量放到一起做計量分析,很有可能出現偽回歸現象。

在一篇廣受爭議的研究中,Oster發現中國女孩出生比例失調的現象可能主要是由于中國人口中高比例的乙肝病毒攜帶人口。這篇文章雖然結果新穎,在統計上也存在顯著的相關性,但是顯然沒有很強的經濟學理論基礎或者醫學基礎。最后,在學術界廣泛質疑的情況下,Oster被迫運用新的數據,重新得出不顯著相關的結論。

在實證分析中,一定要清楚計量模型的理論基礎是什么?這樣的計量模型是否有道理。沒有理論基礎的計量模型,最后可能純粹成為一個無本之木的數字游戲。

2.時間序列中的偽回歸

時間序列如果在不平穩的情況下,很有可能出現所謂的“偽回歸”。兩個本來不相關的非平穩時間序列,最后的t檢驗結果可能顯著相關。這時需要運用協整檢驗來判定變量之間是否存在偽回歸。

3.空間數據中的偽回歸

在實證分析文章中,由于收集成本較低,省級面板數據被廣泛使用。必須注意的是省級行政區在空間上可能存在互相影響。也就是說,這有可能違背了最小二乘法中的誤差項不相關的假設。

更致命的是,由于空間上的相關和時間序列類似,變量可能在空間上不是平穩的,這可能會導致偽回歸的問題。類似于時間序列,可以運用空間上的協整的方法來檢驗偽回歸。不幸的是,這個空間偽回歸的問題并沒有在實證分析中得到應有的重視,一個重要的原因可能是這樣的檢驗在計量技術上還不夠成熟。從理論計量經濟學的角度來講,這個方向還有很大的發展空間;從應用計量經濟學的角度來說,需要對省級面板(或者地區面板以及縣級面板等)等具有空間上相關的數據的估計結果,保持一個謹慎的態度。

(三)經濟學上的顯著性和統計上的顯著性

計量經濟學的基礎是統計學,所以計量經濟學中的很多檢驗事實上是基于統計學中的檢驗。一般所講的顯著性,即是指統計上的顯著性,和經濟上的顯著性有很大區別。統計上的顯著性只關注于損失方程的概率本身;而經濟上的顯著性更多的關注損失方程的總量。這個區別早就被McCloskey以及McCloskey等作了詳細論述。可惜的是在現有的實證研究中,這兩者的差異并沒有得到足夠重視,這使實證研究的結果,甚至計量經濟學的方法本身都受到質疑。

在統計上,約定俗成的顯著性是指p=5%。在某些情況下,統計上顯著拒絕原假設,卻不等于經濟上有顯著區別。這里舉兩個例子:

第一個例子,假設在研究Cobb-Douglas生產函數的規模報酬一定與否,原假設為α+β=1。經過計量分析后發現α+β=0.99,而且它們標準誤差為0.001。從統計上講,原假設α+β=11%的顯著水準(t=10)被拒絕。但是,從經濟學的角度講,10.99并沒有顯著的差異。

第二個例子,假設在飛機上導入一項新的設備(如新的電池),這可能會影響飛機的安全。如果研究發現導入新的設備后,飛機飛行200次,會發生一次墜機危險。從統計上講,在1%的顯著性水平拒絕了飛機不安全的假設。但是,經過這樣統計檢驗的飛機,有誰敢乘坐?

經濟上的顯著性問題,從理論計量的角度來說,到現在還沒有一個很好的客觀的檢驗標準。但是,按照McCloskey的建議,在作實證分析的時候,必須要意識到這個問題,從而有必要對經濟上的顯著性做一定的討論。

五、參數估計值的穩健性和政策分析

經濟研究的主要目的是為了幫助人們認識復雜的經濟現象,并為政策制定提供必要的參考依據。計量經濟模型估計得到的參數,通常會被用來作為政策分析的基準。從理論上講,計量經濟模型的估計值為隨機變量,所以任何估計值都有其合理性。但是,為了使實際政策分析更加有效,穩定、合理以及值得信賴的模型估計就顯得至關重要。穩定、合理以及值得信賴,就成為了實踐中評價參數估計值的標準。

(一)穩定性

Lucas批評計量經濟模型時指出,計量模型的參數估計值通常是條件于政策變量;當政策發生變化時,估計的參數也會隨之發生變化,所以計量經濟學對現實經濟政策的分析作用不大。如果不能保證參數估計值的穩定性,條件于數據的模型估計結果就成為了“變色龍”:數據變化,模型估計結果也隨之變化。為了應對Lucas批判,計量經濟學家們對變量的外生性作了深入的研究,以期計量經濟學的估計結果能夠為政策分析提供值得信賴的結果。

根據Engle等的定義,變量外生性可以分為3:弱外生性、強外生性以及超級外生性。所謂弱外生性,就是變量生成過程中的信息不會給參數估計提供任何信息,也就是說變量的生成過程對估計結果沒有影響。在時間序列數據中,如果保證了變量弱外生性,內生變量對該外生變量也沒有Granger因果影響,可以定義這些外生變量為強外生性。也就是說,條件于強外生變量,模型并不會降低預測的精度。最后,超級外生性是指即使外生變量的數據產生機制發生變化,估計變量還會保持穩定不變。

對于政策分析來說,最重要的工作就是識別超級外生變量,因為只有條件于這樣的變量,政策分析才能有效;不會因為政策變化而使參數估計發生“變色龍”效應。Favero等對變量的超級外生性以及其檢驗方法作了一個具體的總結。

(二)合理性

作為一個訓練有素的經濟學研究者,對照參考文獻以及經濟理論,應該會對計量模型的參數估計值有一個大體的判斷:這個估計值是否合理;從經濟學理論角度或者對照現有的文獻,計量結果是否可以得到合理的解釋。

例如,在估計中國的食物需求彈性時,如果估計出大米消費的收入彈性為1.3,這顯然沒有道理。按照現階段的中國居民收入水準狀況,大米作為一個生活必需品,甚至可能是一種劣等商品,它的收入彈性應該不會很大,合理的范圍應該在[-0.10.5]之間。另外一個例子,Tian(2012)在一個薈萃分析(Meta Analysis)中指出中國經濟增長中的TFP增長率在改革開放后平均為2%。如果某個研究估計出一個10%或者-10%TFP增長率,這樣的結果顯然會受到質疑。

如果估計的結果不合理,也無法解釋。必須要回頭檢查出錯的原因:是數據原因,還是模型出錯,或者是經濟學理論假設錯了。

(三)可靠性

由于計量模型的結構和數據存在某些問題,計量模型的估計值有時對模型的結構非常敏感。增加一個變量,減少一個變量,或者使用不同的工具變量都有可能對模型的估計結果產生重大影響,有時這種差異可能是本質性的。

由于計量經濟模型的估計值是一個隨機變量,任何變量估計都有其合理性。所以,獲得一個可靠的估計值對論文的質量顯得更加至關重要。

不能因為某種特殊的模型結構而得到一個較理想的估計結果,而在論文寫作中只報告這一組結果。對主要模型的結果,最好在論文中報告23組相近模型的結果,并對他們的差異進行比較和解釋這些差異,這樣會使計量模型的估計值讓人覺得可靠。

六、總結

計量經濟學作為實證分析的主要手法,已經被中國廣大經濟研究者接受。但是,正確運用計量經濟模型,得出一個穩定、合理以及可靠的參數估計值,還沒有一個很好的系統梳理。由于計量經濟學的統計學基礎,不正確使用計量經濟模型,可能會使估計結果不穩健,從而產生“變色龍”一樣的實證結果,導致實證結果的政策分析被廣受質疑。

本文從數據、模型和參數等3個角度出發,分析應用計量經濟學模型在實證分析中要注意的問題:

首先,數據是進行實證分析的基礎。數據按照來源,可以劃分為微觀調研數據、機構統計數據以及實驗數據。在廣為使用的調研數據和統計數據中,系統性誤差包括測量誤差和樣本選擇常常存在。如果無視這些誤差,可能使估計結果不能滿足一致性。如果數據存在系統性測量誤差,工具變量方法通常是主要的解決方案;如果數據存在系統性的樣本選擇問題,Heckman方法是廣為使用的校正方法。

其次,從模型的角度來說,任何模型都包括環境假設、機制以及求解3個組成部分。其中環境假設對計量經濟模型的正確使用尤為重要。在運用計量模型時,必須要清楚了解他們的假設條件,并對這些條件作必要的檢查和檢驗。計量經濟模型區別于統計模型最重要的假設:變量的外生性、許多因素可以造成變量內生性問題。工具變量是對內生性常見的檢驗和校正方法。可是有些研究中,工具變量無從尋找,就必須要依靠實驗經濟學的方法。

偽回歸在計量分析中也不鮮見。偽回歸可能是由模型本身原因造成的,也可能是數據結構造成的。計量經濟學是結合了經濟學理論和統計學的定量分析方法,沒有經濟學理論基礎的計量經濟分析,很可能會導致偽回歸結果。某些特殊的數據結構,如非平穩的時間序列或非平穩的空間數據,都可能導致偽回歸結果。

再次,計量經濟學的基礎雖然是統計學,但是兩者之間還存在一些差異。由于技術上的限制,現有的計量經濟模型的檢驗還是基于統計檢驗,所謂“顯著性”都是統計上的顯著性,這不同于“經濟上的顯著性”。在實證分析中,在討論估計參數在統計上顯著性的時候,也必須要討論經濟上的顯著性,后者有時可能更重要。

最后,計量經濟學的估計結果通常會被運用到政策分析中去,但是Lucas批判認為參數的估計值可能會隨著政策的變化而變化,使計量經濟學無法為政策分析服務。為了應對Lucas批判,計量經濟學家提出了變量超級外生性的概念。條件于超級外生的變量,數據產生機制對估計參數結果沒有影響,這時的政策分析才有意義。

    • 分享到QQ空間
海南省体彩兑奖在哪里