「(印度)海德拉巴附近的村民,被經濟學家調查了實在太多次,以至於,當又一位新的經濟學家出現並來做問卷調查時,一位不耐煩的村民說:『這是要寫博士論文還是碩士論文?我會看情況決定回答要講長一點還是短一點。』」
其實Basu提到的問題,除了可以連到「抽樣轟炸」下的抽樣疲勞等基本的問卷調查問題之外,其實還意涵了另一個做現在以田野實驗為主流的發展經濟學所遇到的另一個麻煩,便是「田野實驗」在選址這件事上,其實不是真的那麼隨機。
RCT作為黃金鐵律
自從Duflo跟Banerjee引領風潮,讓發展經濟學變成以「隨機田野實驗(RCT)」為因果驗證的黃金鐵律之後,大量的隨機試驗研究便冒了出來,然而正如Hunt Allcott在發表於QJE的研究"Site Selection Bias in Program Evaluation",田野實驗就算在美國,往往都有選址偏誤,而在發展經濟學,則是直接進入到了「外效性」與「可一般性」的辯論與研究。
外效性與內效性
RCT作為黃金鐵律,主要是指「內效性(Internal validity)」,然而研究結果能否推廣到不同情境,便依賴「外效性(external validity)」而關於外效性的探討,一個方向便是所謂的整合分析(Meta-Anaylsis),就跟醫學界還有公衛界的指引往往會建立在權威的整合分析,現在發展經濟學界也慢慢走向整合分析來形成政策建議。
而在計量分析上,這幾年關於外效性或可一般性的討論亦是雨後春筍,像Isaiah Andrews 跟Emily Oster的研究,或是Breza、Chandrasekhar跟Viviano利用機器學習進行的整合分析(這是我博一升博二暑假做RA主要參予的計劃),大概都是朝這個「可一般性」的概念前進。
選址偏誤背後的意義:田野實驗需要某種基礎建設
不過,雖然發展學界現在傾向用「外效性」、「整合分析」來去處理選址偏誤所帶來的困擾,但筆者想進一步探討為何選址偏誤會存在,這其實是出於實務上的後勤跟規劃考量居多,這有幾個層次。
第一個是不少哈佛之外的名校,做田野實驗的速度往往奇快無比,但是哈佛的學生們做田野速度卻偏慢,這是何也?筆者過去覺得這很莫名,但這一年慢慢想懂了背後的邏輯。
筆者熟識好些其他名校的畢業生,可以在博五的時候,以三到四個月的速度快速出田野實驗結果,簡直不可思議,而類似的題目,哈佛經濟系的博士生往往要花兩三年蹲點、田野、做隨機分派,才有辦法,而往往會比其他學校博士生做實驗的速度「後來居上」。人家往往做三個月,哈佛學生做三年,顯然有些妙不可言之處。
這主要是出於要進行田野實驗,需要許多的「基礎建設」,而要快速進行田野,最快的方法便通常都是跟大型組織J-PAL或是IGC合作,或是跟一些既有的研究小組連繫,便最終會媒合到幾個有名的發展中國家的非營利組織合作,並透過這些組織在地方的分部與人脈,大規模地問卷調查跟隨機試驗。
然而,這些地方組織出現在哪裡、不出現在哪裡,是有許多原因跟考量的,比方說,有些組織可能單純出於創辦人是某個城市的人,於是在某個城市附近的農村有特別多的據點,都是非常合理跟自然的事。
於是乎,當發展經濟學家要進行研究時,儘管有數百組不同的團隊跟題目,但在這樣的媒合過程之下,往往在實際上做試驗時,常會反覆跑到同個村子來做調研,這也是出於研究者其實並沒有真的去開拓新的田野據點的緣故,而既有的基礎建設,讓研究者可以省下數年功夫,有辦法短短數個月就完成一個實驗,便吸引了許多研究資源的投入。
筆者所在的哈佛經濟系雖然也有不少老師是J-PAL或是IGC相關的學者,但多半比較強調是「親自找點跟蹲點」,這可以避開上述的「大家都到同個村子裡做調查」的荒謬情況,但代價就是往往要噴上大量的研究經費跟田野的時間,哈佛的學生往往都要想辦法自籌研究經費,一來一往,就是為了類似的題目,別人做三個月,哈佛的學生往往要孵蛋至少兩到三年,有的學長姐甚至田野調研了十年,便是出於此故。
是為記。
















