分為兩大類:以同儕審查研究為基礎的實證研究系列,以及在哥倫比亞大學 Teachers College 兩週受訓、依日程整理的研習現場。每篇都把學術發現轉化成你今天就能帶進課堂的具體做法。
每篇對應一份近年同儕審查研究,依教學主題分組。點下方主題可快速跳轉。
全英語授課不等於「禁止母語」。研究顯示,有策略地讓學生運用母語資源,能降低認知負荷、釐清專業術語、提供情感支持——關鍵是「刻意設計」而非放任。
EMI 的意義建構不只靠語言。手勢、圖像、語調、實作示範都是教學資源,把它們和語言一起編排,才能真正幫學生跨越語言障礙理解學科內容。
通用英語課程不足以支撐 EMI。學術素養必須嵌入學科、由專業教師與語言專家協力傳授——讓學生先分析一個文類的社會脈絡與溝通目的,再分析語言形式。
EMI 學生普遍用機器翻譯提升閱讀理解、詞彙與閱讀速度。與其視為作弊,不如把它定位為閱讀艱澀學科文本的合法鷹架,並提供明確的使用指引。
Coxhead 的學術詞彙表僅 570 個詞族,卻佔學術文本約 10% 的篇幅;統合分析顯示重複接觸與附帶詞彙學習的相關達 r = .34。把學科關鍵詞變成明確、重複、有檢核的教學標的,是 EMI 投資報酬率最高的一步。
兩份統合分析一致支持廣泛閱讀:相對控制組效果量 d = 0.46–0.57,前後測對比達 d = 0.71–0.79。大量、自選、低難度的課外閱讀,是 EMI 學生累積學術英語語感最可行的長期路徑。
有效提問不是「多問高層次問題」就好。研究指出,真正促進互動的老師會刻意「編排」高低認知層次問題的組合,並在權威式與對話式取向之間切換。
同樣的內容,講得好不好懂差很多。研究歸納出 12 種講者「明確化」策略,最常用的三招——重述、修正、換句話說——幾乎零成本,卻能明顯提升學生的理解。
教師提問後平均等不到 1 秒就接話;研究顯示候答時間超過 3 秒這個門檻後,學生回應長度可增加三到七倍,高層次思考與成就同步提升。對需要先翻譯再思考的 EMI 學生,這 3 秒尤其關鍵。
多語學生用生成式 AI 寫作時,會調動完整的語言資源並批判性地調整 AI 產出。教師該做的不是禁用,而是引導學生發展「批判性學術寫作者」的身份。
一份 387 人的 EMI 研究發現:語言能力較弱的學生,傾向用生成式 AI「取代」而非「補充」自己的語言努力。教師應設計促進「互補式」整合的任務。
英語即時字幕在一項前導研究中提升了內容理解,但同一研究團隊後續的眼動實驗卻發現反效果。本文誠實呈現這個「有潛力但尚未定論」的科技工具。
統合分析顯示,同語字幕影片相對無字幕影片在詞彙學習上效果量達 g = 0.87,影片理解亦有大效果;同語字幕利於語言學習、母語字幕利於內容理解。EMI 預錄教材應預設配上英語字幕。
EMI 評量常只在期末打分數,而且暗中評量了語言卻沒說清楚,對學生並不公平。把評量變成教學中的「回饋循環」,並培養專屬 EMI 的評量素養,是被忽略卻關鍵的一環。
學生英語講錯時,糾正怕打斷、不糾正怕僵化。研究歸納出 recast(不打斷地示範正確說法)與 elicitation(引導學生自己改)等做法,搭配小組動態評量,還能降低口說焦慮。
統合分析顯示同儕回饋對 L2 寫作的整體效果量達 d = 0.73,效果不遜於教師回饋;研究並指出給回饋者的獲益往往不亞於收回饋者。前提是必須先做回饋訓練,否則品質與信任都會落空。
對 83 份研究的系統性回顧指出:EMI 帶來英語增益的證據有限,內容學習是否受損也尚無定論;CLIL 的表面優勢更可能混入選擇效應。成效不會因換了授課語言自動發生——它是教學設計的產物。
對 133 份問卷與 12 場訪談的研究顯示:EMI 有效教學需要的是「語言 × 教學法 × 學科」的交集能力,而非英語檢定分數的延伸;教師普遍歡迎認證與培訓,但幾乎沒有大學將其列為優先事項。
追蹤 28 名學生三年、輔以約 3,000 份問卷的香港縱貫研究指出,EMI 新生面臨四大困難:學科技術詞彙、聽懂講課、學術文體與制度要求;困難高峰在大一,支持措施投放在第一年效益最高。
把「重讀」換成「自我測驗」,是學習科學中實證最厚的高效策略(g≈0.50)。而且只要在測驗後立即給正解回饋,效益還會再翻倍。
同樣的複習量,分散在多次比集中在一次有效得多。而且「要記多久,就把間隔拉多長」——間隔排程要依保留需求調整。Dunlosky 等將它與測試效應並列為最高效用的兩招。
把不同概念/題型混合練習(而非一種練完再換),整體有中等效益(g=0.42);但效果高度依材料而定——視覺材料最好、單字反而適合集中練。交錯有效,但不是萬靈丹。
回饋有效(立即回饋 d≈0.80),但「立即 vs 延遲」沒有單純的勝負——難任務/低成就者宜立即回饋,易任務/重遷移/高成就者反而延遲較好。
對初學者,先研讀「逐步解法範例」再練題,比一開始就埋頭解題更有效(數學 g=0.48)。範例降低認知負荷,讓學生把心力放在理解解題結構上。
在學習時請學生對自己解釋「為什麼、怎麼來的」,能顯著提升理解與遷移(g=0.55)。研究更直接建議用「電腦自動產生的自我解釋提示」——正好適合 AI 助教遞送。
教材的圖、文、聲怎麼搭,影響學習成效(整體 g=0.37)。移除無關細節、圖配旁白(而非螢幕長文)、用對話口吻等原則,效果量可達 0.7–1.0。設計教材時遵循這些原則,幾乎零成本提升理解。
學生最愛用的劃線、重讀、抄摘要、關鍵字記憶,被大型回顧評為「低效用」。與其讓學生被動重讀,不如引導他們改用提取練習與間隔練習。
在教學前先讓學生猜答案,即使注定答錯,也能促進後續學習。Pan 與 Sana(2021)跨五個實驗發現,預測(先考再教)的效益可與後測相當、甚至更佳,且跨題型與延遲皆成立。
讀到事實性敘述時自問「為什麼會這樣」,迫使新知識連結既有知識網。Pressley 等(1987)發現自己生成解釋勝過讀現成解釋;Dunlosky 等(2013)評為中等效用、實施成本極低的策略。
流暢感是學習的假象:當下表現好不代表長期記得住。Bjork 夫婦提出間隔、交錯、測驗與變化情境四類合意困難——刻意讓練習變得有挑戰,換取長期保留與遷移,但難度須落在學生能力範圍內。
工作記憶容量極小,教學設計首務是清除無效負荷。Sweller 等(2019)二十年回顧整理內在與外在負荷之分,以及分散注意力、冗餘、專業知識反轉等可直接操作的教學效應。
Wisniewski 等(2020)統合 435 個研究發現回饋整體效果 d = 0.48,但高資訊量回饋遠強於單純對錯增強。Hattie 與 Timperley 的四層次模型指出:指向歷程與自我調節的回饋最有力,個人讚美最弱。
讓學生用自己的話重新產出所學(摘要 d≈0.50、繪圖 d≈0.40)能促進理解,但前提是「有指導、有訓練」——這正是有效生成與無效抄寫的分水嶺。
一份「大學生專屬」的統合分析:有系統的 SRL 訓練能同時提升成績(g=0.37)、後設認知策略(0.40)與動機(0.35),整體 g=0.38。以後設認知為基礎的訓練效果最大(0.63)。
先讓學生在「還沒教過」的難題上掙扎、再正式教學(PS-I),比傳統先教後練多出 g=0.36 的優勢,高保真設計可達 0.58。但注意——這份禮物適合高中以上,對小學生反而會反轉。
學生常高估自己的掌握度,而校準是可訓練的(效果小到中等,g=0.25 至 g≈0.57)。關鍵在讓學生對照「預測」與「結果」、提供外部標準——但不是每種後設認知介入都有益。
把文字概念親手畫成圖迫使學生選擇、組織、整合,是強力的生成式學習策略。但 Fiorella 與 Zhang(2018)指出明確邊界條件:繪圖認知需求高,需半成品圖、明確指引與對照回饋等鷹架才穩定有效。
Kobayashi(2019)統合 28 個研究:準備要教 g = 0.35,實際教出來 g = 0.56,互動式教學效果更大。Fiorella 與 Mayer(2013)顯示真正開口教過的學習增益更持久——錄講解影片或向 AI 解釋即可啟動。
在文字旁加上「組織型圖示」(流程圖、結構圖)對科學文本學習有穩定正效果(g≈0.23)、對閱讀理解達中等(g≈0.39)。關鍵是用承載概念關係的圖,而非裝飾性插圖。
用書寫來學習有效但效果偏小(d=0.17)——而且有效的不是多寫,是加入「後設認知提示」(讓學生寫我哪裡還不懂、這概念和前面怎麼連)。要求學生反思回饋時效果更高(ES=.44)。
讓學生互相當小老師,對大學生有中等正效果(g≈0.48),且雙向得利——當小老師的學生自己也提升約 0.43。「教別人」是最有效的學習方式之一。
明確教推論、摘要、自我提問,學生學得會策略(d≈0.79),但轉化成標準化理解測驗分數就難得多(d≈0.19)。含「設定閱讀目標」的策略包效果更大;大學常假設學生自然會讀卻從不教。
「筆比鍵盤強」的經典結論在 Urry 等(2021)直接重複驗證與八研究小型統合中未能重現。證據真正支持的是處理深度:用自己的話重組勝過逐字抄錄——關鍵在怎麼記,不在用什麼記。
整合 57 個實驗的統合分析顯示:並排比較兩個案例、引導學生找出共同深層結構,對比逐一學習的效果量為 d = 0.50。幾乎不需新增教材,只需改變呈現順序——先比較、後揭示原理。
50 個對照研究的統合分析:提供逐步引導與即時回饋的智慧導師系統,使測驗分數中位提升 0.66 SD(第 50 → 75 百分位)。現代 LLM 導師正是這條數十年研究脈絡的延伸。
設過關門檻、未達標補救重測的精熟學習,103 個考試成績研究平均效果 0.52 SD(第 50 → 70 百分位);高精熟標準子群連標準化測驗也有 0.60 SD——堅持門檻、提供再學的機會,才是效果來源。
45 個研究的統合分析:AI 適性學習相對非適性教學 g=0.70。但另一份 16 個 RCT 的分析提醒:「適應學習者程度」的高個人化(0.35)遠勝僅客製興趣或回饋的表面個人化(整體僅 0.18)。
PBL 對技能應用與批判思考效果中等偏大(d≈0.46–0.64),對短期基礎知識卻可能略負——但知識劣勢會隨時間消失。你測什麼、何時測,決定它看起來有沒有用。
同一篇統合分析裡,未輔助的發現比直接教學還差(d=−0.38),加上鷹架與回饋的引導式發現則勝出(d=+0.30)。主動學習的價值不在放手,而在給對的引導。
半世紀、328 篇研究、近 4,000 個效果量:明確示範與充分練習的直接教學有中等效果(d≈0.60),且幾乎不隨時間衰退。對初學者建立基礎概念特別有效。
提問—澄清—摘要—預測四策略、學生輪流帶領,能提升閱讀理解。但效果依測量工具分歧——貼近教學的自編測驗 d=0.88,遷移到標準化測驗則 d=0.32,兩個都要看。
整合 225 個研究的統合分析顯示:主動學習讓考試成績提升約 6%,純講授的不及格風險高 1.5 倍。但隨機實驗也發現學生「實際學得多、感覺學得少」——事先公開證據是化解抗拒的關鍵。
統合分析顯示專題式學習對學業成就的效果量達 d = 0.71,但效果受學科、時數與科技支援調節。高教研究多測「學生喜不喜歡」,要學得深,需要驅動問題、階段鷹架與真實觀眾三者齊備。
72 個研究的統合分析顯示:有引導的探究使學習成果提升 d = 0.50、任務表現提升 d = 0.71;另一份統合分析發現教師主導的探究效果量比學生自行主導高出約 0.40。純發現式學習並不可行,「探究+引導」才是答案。
人人都說好的差異化教學,嚴格實證其實有限:初等教育統合分析僅見小幅正效果,固定能力分組甚至對低成就者有害;中學十年間僅 12 個合格研究。務實路線是彈性分組與分層任務兩個低成本槓桿。
統合分析顯示遊戲化對認知(g=0.49)、動機(g=0.36)、行為(g=0.25)都有正效果,但原作者把認知效果定調為 small——不是掛上排行榜就有效,設計品質才是關鍵。
114 個研究的統合分析:翻轉教室對學習成效有小幅正效果(g≈0.36),對滿意度卻沒有影響。最關鍵的調節變項是「加入測驗」——課前影音一定要搭配檢核小考。
兩篇獨立統合分析:即時答題系統對投入/情意的效果近中等,對認知成效則取決於用法——搭配同儕討論(解釋並辯護答案)效果遠大於純講授中使用;它同時也讓教師更準確掌握學情。
讓學生互評,效果不輸老師親自批改(g=0.28),整體對學業表現有正效果(g=0.31 至 0.606)。最關鍵的是:搭配線上科技會放大互評效果——這正是把互評搬上平台的直接論據。
425 篇研究的統合分析:CSCL 的效益是「協作 × 電腦 × 支持策略」三層疊加——協作本身(知識 g=0.42、技能 0.64)、電腦使用(小組任務 0.89)、協作腳本(0.38)缺一不可。
142 個效果量的統合分析:用概念圖學習整體 g=0.58。關鍵在於——學生自己建構概念圖(g=0.72)明顯高於研讀現成的(g=0.43),生成式參與才是效果核心。
五個大型前註冊隨機實驗未能複製出拼圖法預期的學習效益(預設 d = 0.40 未獲支持)。經典方法不等於免檢——專家組品質檢核與個人責任測驗,是讓拼圖真正拼起來的兩道關鍵閘門。
統合分析顯示合作學習對學業成就的效果量約 0.54,但效益來自正向互依、個人責任等五個結構要素。把學生分成小組只是容器,互依結構才是引擎——缺了結構,小組只是坐在一起的個人。
對全體學生平均效果極小(d≈0.08),但對低社經、學業風險學生且校園文化支持時有小而真實的效果。它不是特效藥,而是「對的人 × 對的環境」才見效的精準工具。
涵蓋 16,523 人的統合分析:設定目標有小至中等的穩健效果(d=0.34),當目標具體、有點難度、公開承諾、以行為為標的時效果最佳。
教學生把學業挫折重新歸因為「可控、可改變」的原因,對失敗傾向的高風險大學生效果最明顯——甚至能提升 8 年畢業率。這是少數直接在大學情境、以真實畢業率為終點的動機介入。
針對大學生的 RCT 統合分析:認知行為等取向能明顯降低考試焦慮(g≈−0.64),但轉化到成績的效果小很多(g≈0.28)。先把幫助學生本身當成目標。
系統性回顧 59 篇大學研究顯示,學業自我效能與成績呈穩定中度正相關,且兩者互為因果。它最強的來源是精熟經驗——把課程切出早期可達成的成功,比任何信心喊話都有效。
涵蓋 344 個樣本、223,209 名學生的統合分析顯示:出於興趣與認同的自主動機穩定預測成績與堅持,靠獎懲撐起的外在動機則幾乎無效。提供選擇、說明理由、承認負面感受是三個低成本起點。
讓學生自己寫「這跟我的生活有什麼關係」的短文,能顯著提升低成功期望學生的成績與興趣;在大學生物課中,這個介入把第一代兼弱勢族群學生的成績差距縮小了 61%。
Walton 與 Cohen 的一小時介入讓弱勢族群學生三年後的成績差距縮小一半;2023 年涵蓋 22 校、26,911 人的大規模驗證確認效果,並標出邊界——環境必須真的提供歸屬的機會。
哈佛 194 名物理生的交叉 RCT:精心設計的 AI 導師,學習成效顯著勝過課堂主動學習(effect size 0.73–1.3 SD),學得多、花得少。關鍵是 AI 導師建立在「主動學習」原則上。
統合 37 篇研究,ChatGPT/AI 聊天助教對學業成就有中等正向效益(g=0.577)。證據支持把 AI 助教納入教學,但這是快速演變領域,數據截至 2025。
統合 26 篇研究、2,468 名參與者的分析顯示,AWE 對寫作品質有大幅正向效果(g = 0.861),且對大專與 EFL 學習者效益最高;但高層次論證回饋仍是教師的主場,分工才是正解。
統合 69 篇與 35 篇實驗研究的分析顯示 ChatGPT 對學習有中度正向效果(g = 0.670),但異質性大、設計決定成效;曾報告大效果量的首篇 meta 已被撤稿,提醒對初期數字保持審慎。
兩份系統性回顧(945 篇篩出 93 篇;SRL 視角)的共同結論:多數儀表板缺乏學習理論基礎,對學習成效的嚴格證據有限。指標要連到「下一步行動」、參照點預設「跟自己比」,儀表板才能支持學習。
用完整教育遊戲學習對認知有小到中等正效果(d≈0.29–0.33),但「遊戲自動提升動機」是迷思。關鍵是「遊戲+教學鷹架」——與「遊戲化」是不同概念,別混淆。
沉浸式 VR(頭戴顯示器)對學習有小效果(ES≈0.24),且在高教比 K-12 更小;短介入效果反而較大,暗示新奇效應。最適合需要空間想像、危險或昂貴實境的特定學科。
模擬至少與傳統實作同等有效,但加入鷹架、回饋、反思的「強化型模擬」才有額外的中等效果(g+≈0.43)。對昂貴、危險、不可重複的實驗是高 CP 值選項。
110 篇研究的統合分析:行動裝置融入教學有穩健的中等效果(ES≈0.52),而探究導向的行動學習效果最大(g=0.84)。問題是「用手機讓學生去探究什麼」。
統合分析顯示 AR 對學習收穫有中度效果(d = 0.68),在空間性與不可見概念上最能發揮;後續 41 篇研究的分析指出協作學習是最有利的教學搭配,但須謹防新奇效應。
統合 68 個效果量的分析顯示,教材中有趣但無關的圖片與趣聞整體拉低學習表現(g = −0.33),保留與遷移皆受損;緊鄰關鍵圖表或持續停留在畫面上時傷害最大。
Uedu 團隊已在平台上完成的實證研究——每篇都是「這個教學法真的能在 Uedu 上做出來、而且驗證有效」的證明,並附如何在你的課堂複製。點卡片看完整論文。
如何複製:在 ClassroomGPT/mygpts 頻道用 system prompt 設「講師+助教」雙角色;前後測學習自主性、自我調節與內在動機量表。
如何複製:用測驗系統的 AI 自動出題+即時回饋;比較導入前後的成績與作答資料。
如何複製:在討論區開啟 AI 貼文評分鷹架;觀察貼文品質與跨領域互動量的變化。
如何複製:用 ClassroomGPT 圖像生成輔助抽象概念(如智財權);組間比較概念理解。
如何複製:建學科專屬 ClassroomGPT+上傳教材到頻道知識庫;測程式作業表現與技能自動化。
如何複製:用 Bloom 認知層次分析評估學生對話的認知表現,作為形成性評量。
如何複製:用學習軌跡分析(知識圖譜+LLM)追蹤學生的概念掌握與學習路徑。
如何複製:在多門課開 ClassroomGPT 助教;分析跨學科的採用型態與認知投入。
如何複製:用 Uedu Fit 串接 Garmin 蒐集 HRV;觀察生理狀態與學習表現的關係。
2025 年 2 月 3–14 日,Fulbright Taiwan × Teachers College 兩週 EMI 受訓。請從左側日期選單瀏覽各天場次。
2025 年 2 月,在 Fulbright Taiwan 補助下於哥倫比亞大學 Teachers College 進行兩週 EMI 受訓。最大的體悟是:EMI 不是「把原課程翻成英文」,而是要用英語重新設計整套教學活動。
哥大 Lenger Kang 博士的核心洞見:閱讀是一種情緒經驗。文本之所以「難」,來自學術詞彙、文本結構、先備知識、個人關聯四大障礙——而每一道障礙都有對應的橋樑。
哥大 Ober 教授談 EMI 評量:用逆向設計從「期望結果」反推,把評分標準的語言期待說清楚,降低學生的評量焦慮,並在測驗中接受跨語言實踐,把母語視為展現所學的資源。
哥大 Moffett 博士提醒:AI 會「很有自信地」說錯(hallucination),在語言與翻譯情境尤其要警覺。他也拋出一個 EMI 教師必須面對的問題:在 AI 時代,什麼算作弊?
哥大 Minh Le 以 TPACK 與多模態學習框架,示範如何在 AI 時代用視覺、聽覺、互動等多重管道教學,並提供一套務實的 AI 工具選擇與課堂導入原則。
哥大訪問學者林博士比較 K-12 的五種雙語教學模式與高教 EMI 的差異——釐清 EMI 把英語當「工具」、語言學習是附帶這件事,能幫我們避免對 EMI 的常見誤解。
哥大 Pizmony-Levy 教授帶我們追問國際評比(PISA、TIMSS)背後的問題:你怎麼知道?怎麼定義「品質」?對 EMI 教師,這是一堂關於「不被排名綁架」的評量素養課。
哥大 Ripkey 博士談 EMI 的制度推動:區分「改善」與「變革」,用 SWOT 與利害關係人分析,並提醒每位教師都可以是「改變的推手」。EMI 要成功,需要整個機構的文化改變。
哥大 Nguyen 博士從跨文化溝通切入 EMI:英語作為國際共通語,不該用單一的母語者標準來評斷。EMI 應採 Global Englishes 視角,把學生的母語與母文化視為資產。
哥大 Limerick 教授以厄瓜多 Kichwa 與西班牙 Basque 的案例提醒:「標準語言」其實是一種意識形態建構。這對台灣 EMI 如何看待學生的口音與語言變體,是重要的一課。
哥大 Creider 博士區分「參與」(與人連結)與「投入」(與想法連結),並提醒:一個人回答不等於全班參與。她的小組角色與句型鷹架,讓全班都能同時開口。
本系列文章以實證研究與國際研習為基礎,引用來源均經查核。
想看完整教學設計指引?前往 EMI 教師指南。