在閱讀大量文獻的過程中,一個被世界銀行、J-PAL及各國政府大力推廣的教育模式,在多篇研究中反覆出現:「依程度施教」(Teaching at the Right Level, TaRL),亦稱「目標式教學」(Targeted Instruction)或「差異化教學」(Differentiated Instruction),是現今國際組織大規模投入經費的重要計劃。
該模式主張是教學應依據學生的實際學習程度,而非年齡或年級來組織,學生在入學時,應該先經由簡易評估工具(=考試,或美其名為前測(Baseline Test)),再依照各個學生的程度進行分組。分組之後,各組從學生已知的知識水準出發,進行基礎讀寫與算術的強化教學。此模式源於印度NGO Pratham,經諾獎得主Banerjee與Duflo等人多年的實驗,推廣成為了主流,據J-PAL統計,該教育模式已觸及超過全球八千萬名學童,並在Banerjee與Duflo兩人得到諾貝爾經濟學獎後,獲得廣泛政策關注。截至2023年底,此一模式已被納入非洲與南亞十六個國家的教育政策。
老概念重新上市:教育學界的老文獻
然而,作為東亞文化圈的研究者,筆者對此有強烈的既視感。「因材施教」在中國教育傳統中有兩千餘年歷史:孔子依子路與冉有性情之異,對「聞斯行諸」同一問題給出截然相反的回答,此處可追於《論語·先進》。
至南宋朱熹,更有明確的理論表述:「聖人之道,精粗雖無二致,但其施教,則必因其材而篤焉」,見於《四書章句集注》。
這概念上之古老,並非東亞獨有。
倫敦大學學院教育學院Angela Little教授在評論TaRL時指出,晚期羅馬教育中讀寫教學便已依照個別學生的程度調整,十八至十九世紀的導生制(Monitorial System)在超過三十個國家依學生掌握程度逐級分組。
Little直言,TaRL是一個舊觀念,其觀念雖舊,並不減損其價值,但推廣者應認識到相關文獻遠比他們所引用的更為廣泛。無論從東亞儒學傳統、歐洲教育史,還是二十世紀以來關於能力分組的龐大實證研究來看,TaRL所仰賴的核心原則都談不上是一項新發現,然而早期「能力分組」的教育研究,在教育學界已累積了不少研究,發現在不同的脈絡底下,其結果是好壞雜陳,而筆者隨意搜尋,便可以找到許多的教育研究的Meta-Anaylsis在談相關的利與弊。
TaRL的教育現場多半就是能力分班
「因材施教」當然是各國教育的重要理念。
然而,從筆者對TaRL目前實務運作的理解,世界銀行的相關倡議者會強調其與傳統能力分班(tracking / streaming)之間存在重要的結構差異:分組是臨時性的,學生可依學習進展在組別之間流動,而非被永久分流到某個固定的教育軌道;TaRL著重於基礎讀寫算術的短期補救教學,而非對整個學齡群體的長期分流;TaRL分組是依據簡易評估工具所測得的當前學習水準,而非智力測驗或入學考試的一次性結果。
然而,筆者在仔細閱讀多篇田野實驗論文後發現,TaRL在實際執行層面上,與臺灣教育界長期批判的能力分班之間的距離,比理論宣稱的要近非常多。
在不少田野實驗中,在非洲或印度的學生所謂「依程度分組」的TaRL實際操作,就是將學生按成績高低分入不同班級由不同教師授課,而對教授高程度組別教師的額外激勵被證明能降低教師缺曠率——這與臺灣過去能力分班制度下資深教師偏好教資優班的結構性誘因如出一轍。在許多國家的本質上,就是粗分成三種班:資優班、普通班跟放牛班。
這要怪印度與非洲的師資不足嗎?筆者認為非也。師資問題多半反應在缺曠率上,在筆者整理過的肯亞跟印度多個學校的資料,筆者發現老師的缺席率可以高達五成,學生的缺席率也可以高達五成,給定兩者都那麼愛翹課,要遇到對方還真不容易。但是這些師資問題本身並不是導致能力分班,而是TaRL的模式:事前測驗再「暫時」分組。
筆者看過這些「測驗」,的確就是在測試孩子的程度,甚至有些題目就是Raven Test跟認知測驗的風格--等等,這不就是在事前先測IQ嗎?
然而,一旦分進組別後,許多實務上會再進行「重分組考試」,而大部份被放到頭班的學生都會繼續待在頭班,尾班的學生依然會待在尾班!這正是因為TaRL的許多邏輯,本質上就是能力分班,躲也躲不掉,而許多頂級期刊研究,也正是從能力分班(Tracking)著眼,分析TaRL的好處,等於是用抽象的經濟語言,建議應該要有放牛班的存在。
為何有孩子總是落後?
倫敦政治經濟學院的一篇批評文章則問了一個Firster Oder Question: 如果所有孩子都從一年級開始入學,為何有些人落後而有些人沒有?
世界銀行的TaRL並沒有回答這個核心問題。該文以公共衛生作類比——如果孩子反覆生病,比起不斷給藥,更應該去修理受汙染的水源。TaRL在本質上是症狀處理,而非對發展中國教育體制的深層問題的系統性改革。
這引出一個知識生產的問題:為何一個跨文化的古老教育原則,需要經由RCT的方法論認證才能獲得國際發展機構的政策合法性?TaRL的知識譜系幾乎完全建立在英語學術圈的引用網絡之內,從未引用東亞、中東或其他傳統中的相關論述。Little教授更質疑世界銀行全球教育證據顧問小組(GEEAP)將TaRL推薦為「明智之選」時,僅標註其適用於「大多數中低收入國家」,實質上等於忽略了個別國家的分組傳統(被分到放牛班是否會從此被污名化?)、課程結構、評量實踐與教育信念等等等的具體脈絡。
筆者認為,這裡事實上存在著一個教育政策史上的弔詭:在臺灣跟東亞國家,能力分班因標籤效應與階級再生產有關的研究,早已被廣泛批判,但同樣的邏輯,經由RCT研究重新包裝、以英語論文發表、再經世界銀行推廣至非洲與南亞時,便獲得了「創新」與「實證基礎」的光環。
TaRL的困難之處
當然,筆者必須替TaRL說句公道話,TaRL面對的問題是真實而嚴峻的。世界銀行估計,2019至2022年間中低收入國家「學習貧困」兒童比例從57%升至70%。而各地RCT結果確實顯示TaRL帶來了一定程度的教育效果的提升,但值得注意的是,TaRL是否有成,也因執行模式而有顯著差異,比方說根據Banerjee還有Dulfo在印度的研究,政府教師在學年中執行的模式效果較為溫和(如印度哈里亞納邦的0.15 SD),而由NGO人員執行的短期密集營隊模式效果最大(如北方邦的0.70 SD)。
近來以馬達加斯加為首的近期實驗,則高達0.56 SD的提升。這一差異本身即說明:最令人印象深刻的實驗結果,恰恰來自最難以被政府體制常態化維持的執行模式。
從這角度來想,我們可以思考一下為何既有RCT實驗,往往都只有短期「衝刺班」有效果:只有少部份需要補課的學生有需求,而衝刺班裡被放到頭班跟尾班,對正式開學的分班影響較小。而「衝刺班」的老師往往是外聘的,對於孩子們在一年中正課的待遇還有「標籤」沒有太大的影響。於是乎,如果要把「能力分班」擴大到一年中的正課時間,那自然也免不了要遇到「放牛班的學生在老師們眼裡就是放牛班」的效果。
尾聲
筆者無意否定RCT對因果推論的貢獻,也無意否定TaRL在特定情境下的實際效果。經濟學家們投入大量資源來尋找教學模式,本意亦是良善。
但筆者作為從業人員,認為當發展經濟學家將一個跨文化、跨歷史的教育常識,重新包裝為「經實證驗證的創新典範」時,我們應對這種知識生產的再發現保持某種反思性的自覺。在全球教育治理中,方法論的嚴謹與對既有政策教訓的謙遜,理應並行不悖。














