【北大經院兩會筆談】張延、王琪:人民的希望——隨機對照實驗,用於脱貧攻堅、教育解困
在新冠疫情中,曾被寄予厚望的抗病毒藥物瑞德西韋(Remdesivir,拼音諧拼:人民的希望),在武漢金銀潭醫院的臨牀隨機雙盲試驗,引起了極大的關注。隨機對照實驗不僅可以在自然科學——醫學領域,客觀地評價“神藥”、“特效藥”的效果,挽救生命健康;也可以在社會科學——經濟學領域,評價一項政策的效果,提高經濟效率、減少浪費。如何用隨機對照實驗方法,來脱貧減困,精準扶貧,不僅是貧困人民的希望,也是國家治理能力與治理體系現代化,“貫徹新發展理念,建設現代化經濟體系”、高質量發展的需要。
隨機對照實驗(Randomized controlled trial, RCT)最初源於醫藥學中用於檢測某種療法或藥物效果的控制性臨牀實驗。
儘管早期的對照實驗通過一些方法控制了可能影響實驗結果的部分客觀因素,以儘量提取由不同干預造成的結果差異,但並未強調實驗對象需隨機分組,這極大地削弱了觀測結果的可靠性。直至20世紀前葉,羅納德·費希爾(Ronald Fisher,1925)在進行農業和生物進化領域的實驗研究時,為避免選擇性偏誤引入了隨機化原則,並基於統計理論規範了科學實驗的設計方法,由此形成了更為嚴格的控制實驗法——隨機對照實驗。科學的實驗設計使得觀測結果被更為廣泛接受,也推動了隨機實驗方法在各個領域的應用,包括醫學、藥學、農學、生物學等,並逐漸滲透至社會科學的研究中。
20世紀80年代之前,實證經濟學主要依賴回溯性觀測(調查)數據進行估計和預測,這在評估政策影響時遇到了諸多限制(Duflo,2006)。政策評估中推測因果關係面臨的基礎難題是由於在任一給定的時間點,個體只能處於參與或未參與該項目其中的一種事實狀態,而缺乏與之相對應的反事實結果,例如難以得知參與了某一項目的個體如果未參與該項目將如何表現,這導致研究者無法通過比較事實結果與反事實結果來直接評估在特定時間某一項目對個體的影響。一個解決方法是對比受項目影響的羣體與由相似個體組成的不受該項目影響的羣組,估計項目對一組個體的平均影響,而要使得結果避免選擇性偏誤等風險,需首先將具有相似特徵的個體隨機分配至實驗組和對照組,並嚴格控制可能影響結果的其他因素。至此,在其他學科實驗室中發展了兩百多年的隨機對照實驗的思想被引入社會實驗,並逐步發展為實驗對象在日常環境中做出選擇的實地實驗。大量的實地實驗提供了豐富的觀測數據和政策支撐,實驗內容涉及收入税、健康保險、福利改革、教育等眾多問題。
雖然隨機對照實驗具有隨機性、對照性等諸多優勢,其在實地實驗中的應用仍會面臨很多複雜的統計問題,不同於實驗室中高度可控的環境,在真實生活背景中實施的社會實驗通常更難以控制和捕捉差異。例如,個體可能拒絕參加實驗或中途退出實驗,其影響需在實驗設計及實驗結果中加以考慮(Duflo & Kremer, 2003)。與其他領域的隨機對照實驗的另一個關鍵性區別是,在實地實驗中,干預結果反映的是個體的選擇,即經濟領域的實驗者所探究的因果關係是通過人的行為建立的,因此要理解某一特定干預的影響結果,需理解產生這一結果的個體決策(the Prize in Economic Sciences, 2019)。例如,隨機對照實驗在醫學中被廣泛應用於探究瘧疾、腹瀉等致命疾病的治療方法,但在相關醫療知識非常豐富的今天,仍有大量的低收入國家的兒童死於這些可以很容易避免的疾病。這導致研究者開始思考為什麼這些兒童沒有受到並不昂貴的預防或治療,如何以有效的方式克服相關醫療服務不可得的障礙以降低低收入國家兒童死亡率,這些涉及個體行為的問題無法由醫學實驗回答。因此,以克雷默等(Miguel& Kremer, 2004; Kremer & Miguel, 2007; Kremer, Leino, Miguel &Zwane, 2011)為代表的發展經濟學家,通過一系列特定的隨機對照實驗給出了答案。
克雷默在現實世界中實施了一系列的經濟學實驗,內容涉及教育、健康、理解貧困人口的行為偏誤等。實驗由真正生活於其中的個體做出關乎自身利益的決定,因此可以觀測到更直接、更貼近現實的行為結果,大規模樣本的複雜性也使得研究者可以理解個體間的相互影響和作用,這在減貧實踐和理論研究中具有重要意義。
一、尋找教育減貧的有效措施
自20世紀80年代後期起,宏觀經濟研究開始強調人力資本在增長和發展中的作用,相關的理論和實證研究常用教育程度近似代表人力資本。在考慮了人力資本的作用而進行增長核算時,重要的一步是衡量人力資本回報率,實證工作中常用明瑟收入函數(Mincer earnings function)估計的教育收益率代替。但這一方法面臨三個問題(the Prize in Economic Sciences, 2019):首先,教育水平在不同部門間的差異是個體選擇的結果,這導致基於截面數據來估計教育回報率通常是有偏的。其次,回報是根據受教育年限衡量的,但就人力資本獲取而言,回報在不同時間和地點上並不相等。最後,這一方法對政策改進的作用非常微弱。90年代中期,克雷默及其合作者(Vermeersch &Kremer, 2005; Kremer, Moulin & Namunyu, 2003; Angrist, Bettinger, Bloom,King & Kremer, 2002)發起了發展經濟學的變革,通過隨機化的實地實驗探討了與教育相關的更為精準細微的問題,也正由於教育對於個體實現收入突破、國家實現快速增長的重要作用,克雷默等人在現實環境中評估了多種促進貧困地區適齡兒童接受教育的措施。
二、脱貧攻堅、教育解困 —— 如何提高入學率?
發展中國家需要解決的一個基本問題是以儘可能低的項目成本實現提高入學率的目標。很多貧窮國家的適齡兒童因為要工作掙錢而不去上學,或者由於無法支付學費而輟學,因此提高入學率最簡單的方式是降低上學成本。舒爾茨(Schultz, 2004)發現基於孩子是否上學向家庭提供現金補貼可顯著提高入學率,但這一方法的篩選條件過於表面,在實踐中常常難以保證嚴格將補貼發放給上學家庭,需要探討其他可有效提高入學率的辦法。
1、提供免費早餐。
學校向學生提供免費食物可以保證這一福利僅提供給在學者,克雷默等(Vermeersch & Kremer, 2005)與一個非洲的非政府組織ICS(International Christelijk SteunfondsAfrica)合作在肯尼亞發起了這一研究項目,他們在肯尼亞選取了50個幼兒園並隨機選取其中的25個作為實驗組提供免費早餐,另外25個幼兒園作為對照組。實驗結果表明,實驗組入學率比未提供免費早餐的對照組高30%,測試分數比對照組高0.4個標準差。
2、降低學習成本。
在很多國家,教育對家庭來説有很多私人成本,包括交學費以及購買校服、教材等,通常這對貧困家庭來説是一筆很大的開支。為探究入學率對教育成本的敏感度,克雷默及其合作者(Kremer, Moulin & Namunyu, 2003)選取了14個肯尼亞的學校,隨機選取其中一半提供校服、教材及教室建設費用以減輕家庭負擔,另外一半不接受處理作為對照組,研究結果發現,這一項目使得實驗組學校輟學率有顯著下降。另外,這一教育成本的下降也使得附近學校的學生轉學至實驗組學校,導致其班級規模增加了50%。這表明學生和家長願意放棄較小的班級規模來換取免費的校服、教材和教室建設。研究者進一步發現,同時減免額外費用和增加班級規模對學生成績基本沒有影響。這一實驗指出肯尼亞政府應該放棄部分為減小班級規模所做的努力而增加對教材、教室建設等教育成本的資金支持,這一政府預算的重新配置可以大大減少家長的教育花費並提高參學率。
降低學習成本的另一個直接方式是向學生提供金融支持,克雷默等(Angrist, Bettinger, Bloom, King & Kremer, 2002)在哥倫比亞進行了一項大規模的實地實驗,向隨機抽取的私立學校的小學生提供可部分覆蓋其中學成本的票券,若取得了滿意的成績則票券可持續提供,通過比較獲得票券和未獲得票券的學生可以發現,有票券激勵的學生出勤率和成績均有所提高,而且出去工作、早婚或同居的概率更低。
3、保障兒童健康。
健康問題也是影響入學率的一個重要因素,例如腸道蠕蟲在學齡兒童間感染率很高,克雷默等(Miguel& Kremer, 2004)評估了一個基於學校提供驅蟲藥的項目對參學率的影響,75個學校以隨機的順序逐步加入該項目,研究結果發現,參與項目的學校曠課率比對照組學校曠課率低25%。另外,由於減少了疾病的傳播,這一項目還有正外溢效應,考慮到這一影響,該項目將實驗組中每人的受教育年限增加了0.15年。
在過去的20年,克雷默在發展中國家實施了大量的有關教育問題的隨機對照實驗,得到了豐富的實證結果:在低收入國家,學生對教育成本很敏感,減少自付費用、提供優異學生獎學金和有條件的現金轉移都可以促使貧困學生接受更高教育,解決兒童健康問題也可以經濟高效地增加入學率。但是,如何改善學生在學校的表現是一個更復雜的問題,隨機對照實驗表明增加相同的教學輸入(例如購買更多的教科書或提供配套掛圖)對提升學生成績的作用很小,減小班級規模、向教師提供基於教學成績的獎勵也收效甚微。相比之下,如克雷默等(Kremer, 2003; Kremer, Brannen & Glennerster, 2013)所述,對教師激勵措施和問責制的改革(例如在當地聘用短期合同的教師)以及將教學與學生的學習水平相匹配的教學改革在促進學習方面是非常有效的。
三、隨機對照實驗的結果,直接或間接地影響了發展中國家減貧的政策措施
克雷默的實驗研究方法為解決貧困問題提供了新的思路和證據,直接或間接地影響了發展中國家的減貧政策和項目。其設計的提高入學率、教育改革、改善學生健康等項目給了政策設計者以啓發,並提供了小範圍內實驗效果的精準評估。他的研究成果可與各地區具體背景結合,豐富改革者可選擇的有效政策集合,促使其優化機制設計,合理配置資源。
克雷默的實地實驗不僅可以幫助政策制定者找出有效的扶貧政策,還可以幫其避免將資源浪費在無用的項目上。例如,此前世界銀行曾將對肯尼亞的部分貸款用在了課本提供項目,但克雷默等(Glewwe, Kremer & Moulin, 2009)的實驗指出,以提高學生成績為目標增加教材提供或者其他投入效果均不顯著,因此世界銀行可以將資金轉向對扶貧更有效果的項目;再比如,肯尼亞的學校曾採取分班的方式試圖改善學生學習效果,但克雷默等(Duflo,Dupas & Kremer, 2015)的實驗發現,單純減小班級規模並不是有效的辦法。實地實驗可以指導政策制定者更合理地運用有限的資源,節省了大量的時間和精力。
嚴格而系統的實驗評估具有很強的外部有效性,瞭解某項項目有效或無效的收益不僅侷限於實施該項目的國家或組織,還可以為其他正在尋找可行社會政策或援助計劃的政府、非政府合作組織等機構提供指導。基於實驗結果,已證明成功的項目可以在國內擴大規模甚至被其他國家和地區採用,而失敗的項目可以被放棄。確定項目是否有效也可以幫助國際機構消除關於援助效果的質疑,促使其為落後地區的發展提供長期支持。
總之,克雷默將實驗與發展問題相結合的研究極大地推動了減貧實踐的發展。自從在肯尼亞實施的一系列關於教育的實驗開始,克雷默將宏偉的發展計劃拆解為具體可實施的政策目標,然後進行現實幹預,評估不同措施的成本有效程度,豐富了減貧措施的可選擇範圍和人類對全球發展問題的認知,提高了我們減輕貧困問題的能力,也激勵了大量研究者進入這一領域的研究。
在着眼於現實問題的同時,克雷默開創性的實驗方法為發展經濟學提供了一個新的強有力的工具,後續研究者可以此為基礎研究更為廣泛的問題,發展經濟學進入了為發展政策提供經驗支持的繁榮階段。這一方法也成為經驗研究的一個可依賴的武器,彌補了非實驗實證方法的不足,並將實驗經濟學發展至空前的高度。
此外,克雷默將經濟理論與現實緊密結合起來,以理論為指導探究解決發展難題的思路,並以實踐中的證據反過來啓發經濟學者重新思考理論。他所發展的實地實驗重構了實證研究與理論檢驗之間的聯繫。此前的實證研究常是非實驗的回溯性研究,即基於收集既成事實下的過往數據,評估恰巧已實行的項目,理論被用來支撐所檢驗假設的合理性。克雷默則反過來由理論出發尋找現實中可提供檢驗的證據,通過實地實驗提供了一種預期性評估方式,將待檢驗的假設置於重要位置,通過靈活的實驗設計加以驗證。
因此,克雷默可以由理論框架決定施行何種實驗,隨機對照實驗作為一種研究工具大大提高了實證工作者檢驗和質疑理論的能力,增加了嚴格系統地評估政策效果的客觀科學方法。
作者簡介:

*張延,*北京大學經濟學院教授,博生導師。主要從事微觀經濟理論與實踐、宏觀經濟理論、政策與實踐等方面的研究。在國內外核心學術刊物上,獨立發表學術論文30多篇,並出版學術專、譯著十餘部。留校至今獲教學科研獎多項,承擔多項國家社科基金項目和省部級課題。

王琪,北京大學經濟學院2016級西方經濟學博士研究生,主要研究方向為收入分配、公平認知和行為經濟。