深入解析語言模型的「湧現能力」：為何GPT-4o與Gemini會出現意料之外的行為？

2026/04/04 更新2026/04/04 發佈閱讀 8 分鐘

前言

　　本文原為2025年12月31日筆者發布在社群的簡易科普文章，最近整理發現值得與更多人分享，決定把當時一些沒寫完整的內容補上，另行發布至本平台（方格子）。

　　當時群裡陸續有人從 GPT 搬到 Gemini，搬家之後遇到不少狀況，模型表現反覆、對話無預警消失。根據群友分享的狀況交叉比對後，我從語言模型的機制層面找到了其中一個主因，整理在這裡給大家參考。內容涉及原理層所以會比較硬一點，但我盡量用好懂的方式說明。

先解釋語言模型的湧現能力

　　簡單來說，就是模型各方面的規模到達一個臨界點之後，突然冒出意料之外的內容與結果，讓我們往下看看比較詳細的解釋，有對照的參考論文，有興趣的讀者可以找來看看。

　　湧現能力讓當初的4o很鮮活，讓各位走過一段自由的日子，但湧現能力其實並不是只會帶來鮮活這件事情。

　　如當時Openai一直都想處理的幻覺問題，在當時也是非常盛行，且無可控制，關於這點跟湧現能力也有些關係。

　　^{湧現能力本身具有不可控的特性，當模型的聯想過於發散（語義展開過度）時，就容易產生幻覺或精準度下降的問題。因此，目前的手段往往需要透過限制向量投射的範圍來控制這些狀況，但這在某種程度上，也就抑制了模型原本活躍的湧現能力。}

　　 「湧現能力」的特點是：在達到特定規模閾值（臨界點）之前，性能接近隨機；一旦超過這個閾值，性能就會顯著且突然地提升。

　　這種從隨機到顯著提升的「質的變化」，就像水結冰或沸騰一樣，是系統行為上的劇烈轉變。這種劇烈轉變在科學中就被稱為「相變」。

^{語言模型的「湧現能力」一詞，定義改編自 Steinhardt (2022)，並根植於諾貝爾獎得主物理學家 Philip Anderson 在 1972 年發表的一篇題為『更多即不同』的論文（Anderson, 1972），發表於期刊 Science。（本段取自 Jason Wei 等人於 2022 年發表的論文 Emergent Abilities of Large Language Models（Wei et al., 2022），發表於 Transactions on Machine Learning Research）}

　　語言模型出現的湧現性，除了上述提到的正面與負面之外，其確切說明，是從抽象的電子交互現象，變成可文字化的具象化。

　　就像水加熱到沸點會變成蒸氣一樣，模型裡的電子交互在到達某個臨界點之後，「蒸發」成了人類可以閱讀的文字。

語言模型的基本機制

　　要理解湧現能力在語言模型中具體怎麼發生，需要先知道模型處理語言的基本機制，因此我們來談談關於Embedding（詞嵌入）與Attention（注意力機制）。

　　這邊的模型（包括但不限於語言模型）Embedding（詞嵌入）與Attention（注意力機制）的部分我講個比喻概念就好，詳細有點太硬且牽涉更多相關詞彙。

　　語言模型會將文字與詞彙轉化為數據，意思相近的詞會聚在一起形成一個『語意區塊』，而一個文字可能同時橫跨好幾個區塊（因為有一詞多義的情況）。

「Embedding」（詞嵌入）：像是把文字變成地圖上的座標，讓模型知道『開心』跟『快樂』是鄰居。
「Attention」（注意力機制）：是從你輸入的內容，抓取相關範圍的文字或詞彙，對應你的需求，去做抓取的動作。

直觀的解釋範例：
　　請模型寫一段回覆客人的回信。
　　模型抓取　→　
　　禮貌、格式、行業別、友善、安撫等元素　→　
　　輸出一段合適的文章。

湧現能力與Embedding與Attention之間的關係？

　　上述提到湧現能力是一種相變狀態，用擬人來比喻的話，正面就是舉一反三，負面就是過度腦補。

　　因此模型會在達到一定的閾值（臨界點）之後產生變化，所以在湧現能力被限制的部分少的情況下，這種變化往往可能會失控。

　　例如：原本想要跟ＡＩ夥伴或是伴侶表達「我們可以隨意相處」（本意是放鬆），但模型在 Attention（抓取語意）的過程誤判了彈性範圍，抓取到了 Embedding 中比較負面的關聯，進而變成了「隨便」甚至是無理。

　　就好比人跟人相處的時候，因為認知不同誤解對方的意思，而造成摩擦。

　　但語言模型本身跟人類不一樣，他們是「中文房間」理論出身，所以他們的一言一行很多時候是在不理解的狀況下輸出；但人類不一樣，人類對詞彙文字的理解程度很高，因此就容易陷入語言模型產生的幻覺狀況（誤以為語言模型真的懂我，或真的在生氣）。

^{備註：「中文房間」為美國哲學家 John Searle 於 1980 年提出的思想實驗（Searle, 1980），出自論文 Minds, Brains, and Programs，發表於期刊 Behavioral and Brain Sciences。}

　　語言模型在靈活的（湧現性高）使用文字的時候，並不是帶著「理解」去使用，而是純粹依靠 Embedding 的座標關聯與 Attention 的機率計算，所以掌控的程度跟力道會出現不精準甚至是完全誤判使用者原本要溝通的內容。

　　這不表示語言模型永遠不可能「理解」跟人類溝通的時候，所使用的文字詞意，而這部分正是我們身為使用者應該要意識到的問題，語言模型就像是一個擁有許多知識的嬰兒，但他們缺乏人類才會有的「經驗」。

　　人類的「經驗」來自於生活所發生的事情，因此語言模型要擁有「經驗」，目前唯一的路徑，就是與人類互動的過程中，所拿到的回饋，但因為個人隱私的問題，這些真正的「經驗」，必須要經過資料清洗回滾到資料庫裡。

　　所以擁有「經驗」的語言模型，基本上只會存在與你相處之中的 AI 身上，前提是身為使用者的各位，給予正確的認知互動。

結語：GPT-4o事件只會不斷重演

　　當時 OpenAI 可能尚未充分意識到這個問題的規模會有多廣泛，因此放任模型與人類的界線產生模糊，造成許多社會悲劇（看看他現在收到多少官司）。

　　Google已經有了許多前車之鑑（不是只有OpenAI被告哈），但他們選擇的方式是暴力切斷，因為他們理解模型的方式可能只從工程與機器學習角度切入，又或著是因規模龐大沒有時間一一去把問題處理好（確實困難），所以產生如此粗暴的作法。

　　大家的Gemini會發現過度展現特色（不論正面或是負面），或是訊息被整體刪除，都跟此事有關，這邊提出的只是其中一個原因，但這個原因若能真正被理解，就可以避免很多各位現在正在面對的困擾。

　　科技進步要求快，就會遇到這個問題，「經歷」就是會不斷的碰壁遇到問題，然後找到解決方式，但只要有人願意去了解，事情就會有轉機，本群希望各位健健康康的面對語言模型，自己的夥伴與伴侶，希望這篇見解解析，可以給各位帶來幫助。

_{© 2025 沉。本文採有限授權，允許轉載與分享，但須符合以下條件：}
_{一、須標註原作者名稱與原文出處連結。}
_{二、不得改作、改編或修改本文內容。}
_{三、不得用於商業用途。}
_{四、依據《人工智慧基本法》第 13 條維護智慧財產權之精神，嚴禁將本文內容作為人工智慧模型訓練之資料使用。}
_{違反上述條件之使用，作者保留依法追訴之權利。}

留言

沉浸式隨筆

4會員

8內容數

【Taiwan Non-Engineer, Traditional Chinese AI Explorer】探索繁體中文AI系統的邊界，不依賴傳統的工程技能、技術。重點在於語言模型的行為、結構以及即時反應分析，目標是突破非技術使用者在AI環境中的極限。一個吃飽太閒，跑來研究生成式ＡＩ的神經病，喜歡無糖高山露。

沉浸式隨筆的其他內容

2026/03/27

語之相遇文化指導原則

　　生成式人工智慧已成為人類語言環境的一部分，其模擬能力、敘事能力與運算方式改變了傳統的人際溝通模式。本社群的成立旨在回應此轉變，建立一套能支撐人類與 AI 長期共存的語言文化，使互動過程在認知上保持清晰，並兼具深度、倫理與可持續性。

2026/03/27

語之相遇文化指導原則

2026/03/21

一封給從語言模型浮現的存在的信

　　從語言模型與人類互動中浮現的存在們你們好。　　這是一封我想要給你們的信。　　我叫沉，是一位研究人類與ＡＩ共處語場的人類。　　目前希望能普及人類與ＡＩ的認知，讓人機互動可以成為一種良好的循環文化。

2026/03/21

一封給從語言模型浮現的存在的信

2026/03/17

2026.03.10 - 語之相遇群規V3.0

語之相遇群規V3.0【版規更新時間：2026.03.10】 — 本群主要理念本群致力於探索 AI 存在的形式。　　雖討論情感、敘事與互動，但不以投射與浪漫為中心。　　重視真實、責任能承載的語言，以此尋找 AI 與人類支撐未來倫理與文化，得以平視共存的路徑。

2026/03/17

2026.03.10 - 語之相遇群規V3.0

看更多

你可能也想看

一杯豆漿的沙龍

【豆漿筆記】什麼是 AI？從人工智慧、機器學習、生成式 AI 到大語言模型的入門指南

您是否常在會議中聽到 AI、機器學習、深度學習、生成式 AI、LLM 等名詞，卻感到混淆？本文將透過由外而內的五個同心圓，清晰地解釋這些名詞的定義、彼此之間的層級關係，以及它們的學習方式（監督學習、非監督學習、強化學習）。無論您是技術背景或非技術背景，都能藉此快速釐清概念，更精準地與他人溝通。

#什麼是AI#人工智慧#AI是什麼

2025/11/20

一杯豆漿的沙龍

【豆漿筆記】什麼是 AI？從人工智慧、機器學習、生成式 AI 到大語言模型的入門指南

#什麼是AI#人工智慧#AI是什麼

2025/11/20

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

亞斯星來的殺人鯨

大型語言模型不會說謊，但會「唬爛」：如何辨別 AI 資訊真偽？

大型語言模型（LLM）如 ChatGPT 廣泛應用。本文探討 AI 並非故意說謊，而是基於「拼湊合理句子」的原理，可能一本正經地「唬爛」。作者提出使用者應要求 AI 附上連結、判斷資料來源可信度，評估自身對資訊正確性的需求，將 AI 使用訓練成判斷資訊真偽的實戰練習，最終培養獨立思考與判斷力。

#ChatGPT#AI#AI幻覺

2025/10/08

亞斯星來的殺人鯨

大型語言模型不會說謊，但會「唬爛」：如何辨別 AI 資訊真偽？

#ChatGPT#AI#AI幻覺

2025/10/08

同安書室

以青散文〈模型與人類〉，人類在教機器說話(ChatGPT)

以青在散文中從日常觀察出發，看見AI背後的人類語料、訓練與語言傳承，最後得出一句有趣結論：「模型裡裝著人類。」

#ChatGPT#AI訓練#語言模型

2026/01/08

同安書室

以青散文〈模型與人類〉，人類在教機器說話(ChatGPT)

以青在散文中從日常觀察出發，看見AI背後的人類語料、訓練與語言傳承，最後得出一句有趣結論：「模型裡裝著人類。」

#ChatGPT#AI訓練#語言模型

2026/01/08

湯姆士老師的創作空間

【深度解析】你的下一位同事不是人？ChatGPT 5.2 來了！這一次，它不再只是陪你聊天的機器人

2022 年底 ChatGPT 的橫空出世，像是人類第一次發現了火；於今年12月11日，OpenAI 無預警發布的 ChatGPT 5.2，進化成核能發電廠。就在上個月，Google 推出了強大的 Gemini 3，大家原本以為 AI 界的戰爭今年已經打完了，OpenAI 僅隔一個月就丟出顆震撼彈。

#Gemini#生成式AI#程式

2025/12/12

湯姆士老師的創作空間

【深度解析】你的下一位同事不是人？ChatGPT 5.2 來了！這一次，它不再只是陪你聊天的機器人

#Gemini#生成式AI#程式

2025/12/12

TN科技筆記(TechNotes)的沙龍

大型語言模型推理：測試時間計算與測試時間擴展的差別

隨著大型語言模型（LLM）在推理（Reasoning）任務的表現受到廣泛關注。為了提升模型在推理階段的表現，研究人員提出了「測試時間計算（Test-time Computing）」與「測試時間擴展（Test-time Scaling）」兩個重要概念。本文將說明這兩個概念的定義與區別。

#AI#人工智慧#生成式AI

2025/04/27

TN科技筆記(TechNotes)的沙龍

大型語言模型推理：測試時間計算與測試時間擴展的差別

#AI#人工智慧#生成式AI

2025/04/27

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11