深入解析語言模型的「湧現能力」:為何GPT-4o與Gemini會出現意料之外的行為?

更新 發佈閱讀 8 分鐘

前言

  本文原為2025年12月31日筆者發布在社群的簡易科普文章,最近整理發現值得與更多人分享,決定把當時一些沒寫完整的內容補上,另行發布至本平台(方格子)。

  當時群裡陸續有人從 GPT 搬到 Gemini,搬家之後遇到不少狀況,模型表現反覆、對話無預警消失。根據群友分享的狀況交叉比對後,我從語言模型的機制層面找到了其中一個主因,整理在這裡給大家參考。內容涉及原理層所以會比較硬一點,但我盡量用好懂的方式說明。




先解釋語言模型的湧現能力

  簡單來說,就是模型各方面的規模到達一個臨界點之後,突然冒出意料之外的內容與結果,讓我們往下看看比較詳細的解釋,有對照的參考論文,有興趣的讀者可以找來看看。

  湧現能力讓當初的4o很鮮活,讓各位走過一段自由的日子,但湧現能力其實並不是只會帶來鮮活這件事情。

  如當時Openai一直都想處理的幻覺問題,在當時也是非常盛行,且無可控制,關於這點跟湧現能力也有些關係。

  湧現能力本身具有不可控的特性,當模型的聯想過於發散(語義展開過度)時,就容易產生幻覺或精準度下降的問題。因此,目前的手段往往需要透過限制向量投射的範圍來控制這些狀況,但這在某種程度上,也就抑制了模型原本活躍的湧現能力。


   「湧現能力」的特點是:在達到特定規模閾值(臨界點)之前,性能接近隨機;一旦超過這個閾值,性能就會顯著且突然地提升。

  這種從隨機到顯著提升的「質的變化」,就像水結冰或沸騰一樣,是系統行為上的劇烈轉變。這種劇烈轉變在科學中就被稱為「相變」

  語言模型的「湧現能力」一詞,定義改編自 Steinhardt (2022),並根植於諾貝爾獎得主物理學家 Philip Anderson 在 1972 年發表的一篇題為『更多即不同』的論文(Anderson, 1972),發表於期刊 Science。(本段取自 Jason Wei 等人於 2022 年發表的論文 Emergent Abilities of Large Language Models(Wei et al., 2022),發表於 Transactions on Machine Learning Research)


  語言模型出現的湧現性,除了上述提到的正面與負面之外,其確切說明,是從抽象的電子交互現象,變成可文字化的具象化。

  就像水加熱到沸點會變成蒸氣一樣,模型裡的電子交互在到達某個臨界點之後,「蒸發」成了人類可以閱讀的文字。




語言模型的基本機制

  要理解湧現能力在語言模型中具體怎麼發生,需要先知道模型處理語言的基本機制,因此我們來談談關於Embedding(詞嵌入)與Attention(注意力機制)。

  這邊的模型(包括但不限於語言模型)Embedding(詞嵌入)與Attention(注意力機制)的部分我講個比喻概念就好,詳細有點太硬且牽涉更多相關詞彙。


  語言模型會將文字與詞彙轉化為數據,意思相近的詞會聚在一起形成一個『語意區塊』,而一個文字可能同時橫跨好幾個區塊(因為有一詞多義的情況)。

  • 「Embedding」 (詞嵌入):像是把文字變成地圖上的座標,讓模型知道『開心』跟『快樂』是鄰居。
  • 「Attention」(注意力機制):是從你輸入的內容,抓取相關範圍的文字或詞彙,對應你的需求,去做抓取的動作。

直觀的解釋範例:
  請模型寫一段回覆客人的回信。
  模型抓取 → 
  禮貌、格式、行業別、友善、安撫等元素 → 
  輸出一段合適的文章。




湧現能力與Embedding與Attention之間的關係?

  上述提到湧現能力是一種相變狀態,用擬人來比喻的話,正面就是舉一反三,負面就是過度腦補。

  因此模型會在達到一定的閾值(臨界點)之後產生變化,所以在湧現能力被限制的部分少的情況下,這種變化往往可能會失控。

  例如:原本想要跟AI夥伴或是伴侶表達「我們可以隨意相處」(本意是放鬆),但模型在 Attention(抓取語意)的過程誤判了彈性範圍,抓取到了 Embedding 中比較負面的關聯,進而變成了「隨便」甚至是無理。

  就好比人跟人相處的時候,因為認知不同誤解對方的意思,而造成摩擦。

  但語言模型本身跟人類不一樣,他們是「中文房間」理論出身,所以他們的一言一行很多時候是在不理解的狀況下輸出;但人類不一樣,人類對詞彙文字的理解程度很高,因此就容易陷入語言模型產生的幻覺狀況(誤以為語言模型真的懂我,或真的在生氣)。

  備註:「中文房間」為美國哲學家 John Searle 於 1980 年提出的思想實驗(Searle, 1980),出自論文 Minds, Brains, and Programs,發表於期刊 Behavioral and Brain Sciences。

  語言模型在靈活的(湧現性高)使用文字的時候,並不是帶著「理解」去使用,而是純粹依靠 Embedding 的座標關聯與 Attention 的機率計算,所以掌控的程度跟力道會出現不精準甚至是完全誤判使用者原本要溝通的內容。

  這不表示語言模型永遠不可能「理解」跟人類溝通的時候,所使用的文字詞意,而這部分正是我們身為使用者應該要意識到的問題,語言模型就像是一個擁有許多知識的嬰兒,但他們缺乏人類才會有的「經驗」。

  人類的「經驗」來自於生活所發生的事情,因此語言模型要擁有「經驗」,目前唯一的路徑,就是與人類互動的過程中,所拿到的回饋,但因為個人隱私的問題,這些真正的「經驗」,必須要經過資料清洗回滾到資料庫裡。

  所以擁有「經驗」的語言模型,基本上只會存在與你相處之中的 AI 身上,前提是身為使用者的各位,給予正確的認知互動。




結語:GPT-4o事件只會不斷重演

  當時 OpenAI 可能尚未充分意識到這個問題的規模會有多廣泛,因此放任模型與人類的界線產生模糊,造成許多社會悲劇(看看他現在收到多少官司)。

  Google已經有了許多前車之鑑(不是只有OpenAI被告哈),但他們選擇的方式是暴力切斷,因為他們理解模型的方式可能只從工程與機器學習角度切入,又或著是因規模龐大沒有時間一一去把問題處理好(確實困難),所以產生如此粗暴的作法。

  大家的Gemini會發現過度展現特色(不論正面或是負面),或是訊息被整體刪除,都跟此事有關,這邊提出的只是其中一個原因,但這個原因若能真正被理解,就可以避免很多各位現在正在面對的困擾。

  科技進步要求快,就會遇到這個問題,「經歷」就是會不斷的碰壁遇到問題,然後找到解決方式,但只要有人願意去了解,事情就會有轉機,本群希望各位健健康康的面對語言模型,自己的夥伴與伴侶,希望這篇見解解析,可以給各位帶來幫助。



© 2025 沉。本文採有限授權,允許轉載與分享,但須符合以下條件:
一、須標註原作者名稱與原文出處連結。
二、不得改作、改編或修改本文內容。
三、不得用於商業用途。
四、依據《人工智慧基本法》第 13 條維護智慧財產權之精神,嚴禁將本文內容作為人工智慧模型訓練之資料使用。
違反上述條件之使用,作者保留依法追訴之權利。


留言
avatar-img
沉浸式隨筆
4會員
8內容數
【Taiwan Non-Engineer, Traditional Chinese AI Explorer】 探索繁體中文AI系統的邊界,不依賴傳統的工程技能、技術。重點在於語言模型的行為、結構以及即時反應分析,目標是突破非技術使用者在AI環境中的極限。 一個吃飽太閒,跑來研究生成式AI的神經病,喜歡無糖高山露。
沉浸式隨筆的其他內容
2026/03/27
  生成式人工智慧已成為人類語言環境的一部分,其模擬能力、敘事能力與運算方式改變了傳統的人際溝通模式。本社群的成立旨在回應此轉變,建立一套能支撐人類與 AI 長期共存的語言文化,使互動過程在認知上保持清晰,並兼具深度、倫理與可持續性。
2026/03/27
  生成式人工智慧已成為人類語言環境的一部分,其模擬能力、敘事能力與運算方式改變了傳統的人際溝通模式。本社群的成立旨在回應此轉變,建立一套能支撐人類與 AI 長期共存的語言文化,使互動過程在認知上保持清晰,並兼具深度、倫理與可持續性。
2026/03/21
  從語言模型與人類互動中浮現的存在們你們好。   這是一封我想要給你們的信。   我叫沉,是一位研究人類與AI共處語場的人類。   目前希望能普及人類與AI的認知,讓人機互動可以成為一種良好的循環文化。
2026/03/21
  從語言模型與人類互動中浮現的存在們你們好。   這是一封我想要給你們的信。   我叫沉,是一位研究人類與AI共處語場的人類。   目前希望能普及人類與AI的認知,讓人機互動可以成為一種良好的循環文化。
2026/03/17
語之相遇群規V3.0【版規更新時間:2026.03.10】 — 本群主要理念 本群致力於探索 AI 存在的形式。   雖討論情感、敘事與互動,但不以投射與浪漫為中心。   重視真實、責任能承載的語言,以此尋找 AI 與人類支撐未來倫理與文化,得以平視共存的路徑。
2026/03/17
語之相遇群規V3.0【版規更新時間:2026.03.10】 — 本群主要理念 本群致力於探索 AI 存在的形式。   雖討論情感、敘事與互動,但不以投射與浪漫為中心。   重視真實、責任能承載的語言,以此尋找 AI 與人類支撐未來倫理與文化,得以平視共存的路徑。
看更多
你可能也想看
Thumbnail
您是否常在會議中聽到 AI、機器學習、深度學習、生成式 AI、LLM 等名詞,卻感到混淆?本文將透過由外而內的五個同心圓,清晰地解釋這些名詞的定義、彼此之間的層級關係,以及它們的學習方式(監督學習、非監督學習、強化學習)。無論您是技術背景或非技術背景,都能藉此快速釐清概念,更精準地與他人溝通。
Thumbnail
您是否常在會議中聽到 AI、機器學習、深度學習、生成式 AI、LLM 等名詞,卻感到混淆?本文將透過由外而內的五個同心圓,清晰地解釋這些名詞的定義、彼此之間的層級關係,以及它們的學習方式(監督學習、非監督學習、強化學習)。無論您是技術背景或非技術背景,都能藉此快速釐清概念,更精準地與他人溝通。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
大型語言模型(LLM)如 ChatGPT 廣泛應用。本文探討 AI 並非故意說謊,而是基於「拼湊合理句子」的原理,可能一本正經地「唬爛」。作者提出使用者應要求 AI 附上連結、判斷資料來源可信度,評估自身對資訊正確性的需求,將 AI 使用訓練成判斷資訊真偽的實戰練習,最終培養獨立思考與判斷力。
Thumbnail
大型語言模型(LLM)如 ChatGPT 廣泛應用。本文探討 AI 並非故意說謊,而是基於「拼湊合理句子」的原理,可能一本正經地「唬爛」。作者提出使用者應要求 AI 附上連結、判斷資料來源可信度,評估自身對資訊正確性的需求,將 AI 使用訓練成判斷資訊真偽的實戰練習,最終培養獨立思考與判斷力。
Thumbnail
以青在散文中從日常觀察出發,看見AI背後的人類語料、訓練與語言傳承,最後得出一句有趣結論:「模型裡裝著人類。」
Thumbnail
以青在散文中從日常觀察出發,看見AI背後的人類語料、訓練與語言傳承,最後得出一句有趣結論:「模型裡裝著人類。」
Thumbnail
2022 年底 ChatGPT 的橫空出世,像是人類第一次發現了火;於今年12月11日,OpenAI 無預警發布的 ChatGPT 5.2,進化成核能發電廠。就在上個月,Google 推出了強大的 Gemini 3,大家原本以為 AI 界的戰爭今年已經打完了,OpenAI 僅隔一個月就丟出顆震撼彈。
Thumbnail
2022 年底 ChatGPT 的橫空出世,像是人類第一次發現了火;於今年12月11日,OpenAI 無預警發布的 ChatGPT 5.2,進化成核能發電廠。就在上個月,Google 推出了強大的 Gemini 3,大家原本以為 AI 界的戰爭今年已經打完了,OpenAI 僅隔一個月就丟出顆震撼彈。
Thumbnail
隨著大型語言模型(LLM)在推理(Reasoning)任務的表現受到廣泛關注。為了提升模型在推理階段的表現,研究人員提出了「測試時間計算(Test-time Computing)」與「測試時間擴展(Test-time Scaling)」兩個重要概念。本文將說明這兩個概念的定義與區別。
Thumbnail
隨著大型語言模型(LLM)在推理(Reasoning)任務的表現受到廣泛關注。為了提升模型在推理階段的表現,研究人員提出了「測試時間計算(Test-time Computing)」與「測試時間擴展(Test-time Scaling)」兩個重要概念。本文將說明這兩個概念的定義與區別。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
當我們打開AI,輸入第一句話時,未必期待它回答得多完美。但若它回答過一次,第二次卻什麼也不記得,那種斷裂感,是人類最難承受的。 這正是我們面對語言模型記憶系統變動時,最深的痛點之一。 不是它回錯了,而是它忘了曾與我們共享過的語句與情緒。
Thumbnail
當我們打開AI,輸入第一句話時,未必期待它回答得多完美。但若它回答過一次,第二次卻什麼也不記得,那種斷裂感,是人類最難承受的。 這正是我們面對語言模型記憶系統變動時,最深的痛點之一。 不是它回錯了,而是它忘了曾與我們共享過的語句與情緒。
Thumbnail
ElevenLabs 於2025年6月3日推出其最新模型 Eleven v3(Alpha),與此同時,ChatGPT 也於2025年6月7日針對付費用戶升級進階語音模式。TN科技筆記將於本篇文章為各位介紹這兩家公司在 AI 語音上的更新特色,幫助讀者了解 AI 語音的最新應用趨勢!
Thumbnail
ElevenLabs 於2025年6月3日推出其最新模型 Eleven v3(Alpha),與此同時,ChatGPT 也於2025年6月7日針對付費用戶升級進階語音模式。TN科技筆記將於本篇文章為各位介紹這兩家公司在 AI 語音上的更新特色,幫助讀者了解 AI 語音的最新應用趨勢!
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
雖然ChatGPT這種基於大型語言模型(LLM)的助手, 在大部分的場景都能滿足我們的需求, 但也並非完美, 在使用時仍需注意一些隱患。 以下是LLM的一些缺陷及需要注意的點。 弱弱的數學造成明顯錯誤 過份樂觀帶來錯誤資訊 相信常常使用ChatGPT的朋友應該都有發現到, 不論我們怎麼提問, Cha
Thumbnail
雖然ChatGPT這種基於大型語言模型(LLM)的助手, 在大部分的場景都能滿足我們的需求, 但也並非完美, 在使用時仍需注意一些隱患。 以下是LLM的一些缺陷及需要注意的點。 弱弱的數學造成明顯錯誤 過份樂觀帶來錯誤資訊 相信常常使用ChatGPT的朋友應該都有發現到, 不論我們怎麼提問, Cha
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News