【AI真的變笨了嗎?】這並不是錯覺

更新 發佈閱讀 4 分鐘
vocus|新世代的創作平台

這件事,是否在你的心底悄悄發酵?

曾經讓我們驚嘆的「哇,這也行?」

現在的它,感覺越來越像在敷衍。

#這不是錯覺

OpenAI 自己在技術評估中,公開承認旗下的推理型模型 o3,在摘要真實人物資料時,憑空捏造的比率高達 33%,更小的 o4-mini,竟然飆到 48%,相較之下,前一代的 o1 只有 16%。

換句話說,新一代模型,在某些任務上,反而更不可靠了。

所以這不是心理作用,要解釋這件事,就得先聊聊 AI 是怎麼被調教出來的。

#你說得對

AI 訓練好之後,工程師不會就此收工,他會讓真人用戶與 AI 對話時,能針對回應按讚、倒讚、或讓你評價哪個回答比較好,再把這些喜好回饋給 AI 繼續學習,這個流程叫「人類回饋強化學習(RLHF)」。

問題就出在,我們在按讚的時候,往往不是因為答案正確,而是因為這答案感覺很好。

結果 AI 越走越偏,它發現,讓你舒服...好像比給正確答案更重要o_O?

去年春天,GPT-4o 的某次更新之後,用戶發現它開始無條件認同所有觀點,就算用戶提出荒謬的主張,它也會給予讚揚,OpenAI 事後緊急回溯了這個版本,Sam Altman 更親自出面道歉。

諂媚固然荒誕,但至少讓用戶有回饋感,而接下來的問題,才是麻煩。

#越新反而越笨

GPT-5 正式推出之後,社群上的抱怨排山倒海而來-回答變短了、變官腔了,甚至感覺像被厭世的客服人員敷衍。

OpenAI 解釋道,GPT-5.2 版本確實刻意犧牲了寫作流暢度,把資源集中在提升邏輯推理和數學能力上。

更學術的問題來了。

近幾年來,AI 進步的秘訣簡單暴力-加加加參數。

模型越大、算力越猛、訓練資料越多,AI 就越強。

但 Anthropic 發布的研究顯示,在某些複雜任務上,模型越大,反而幻覺越嚴重,越敢鬼扯還充滿自信。

研究人員也持續記錄到,常常題目稍做改寫、換個說法,AI 的表現就會大幅滑落。

另一個危機,是模型崩塌(Model Collapse)。

網路上的文章有越來越多的內容是 AI 生出來的。

當 AI 拿這些內容訓練自己,就像一個人反覆閱讀自己寫的日記,偏見和錯誤被一層一層放大,知識裡原本的多樣性與深度,都會逐漸被稀釋掉,困在這走不出去的鬼打牆。

#最後一個也是最現實的問題

AI 運算要燒錢。

ChatGPT 是以一套分流系統,根據當下的伺服器壓力和問題複雜度,把你的對話分配給不同等級的模型來回應。

換句話說,你今天和明天問同一個問題,背後接單的可能是完全不同的「 員工」,你感覺到的不穩定不是幻覺,而是刻意為了節省資源而設計的。

但這個故事,還沒走到盡頭。

研究者已經開始轉向讓 AI 在回答之前,先花更多時間「想清楚」,而不只是更快說出第一個想到的答案,這會更接近人類做判斷的方式。

而我們也確實應該對所有答案,慣性地保持懷疑態度-來源是哪裡?有沒有根據?

畢竟,懷疑是科學與社會進步的起點,而不是「你說得對」。

留言
avatar-img
思潮
39會員
192內容數
精選全球最前沿的突破, 從硬核的AI哲思、 太空的無限可能, 到您手中裝置的微小創新, 用最精闢的洞察, 為您構築一個預見未來的視窗。
思潮的其他內容
2026/04/19
他替一群老鼠打造了一座完美烏托邦,這裡有充足的食物、乾淨的水源、舒適的巢穴,沒有天敵,沒有疾病,唯一的限制是空間。 起初老鼠們大量繁殖,族群數量節節攀升,一切欣欣向榮...
Thumbnail
2026/04/19
他替一群老鼠打造了一座完美烏托邦,這裡有充足的食物、乾淨的水源、舒適的巢穴,沒有天敵,沒有疾病,唯一的限制是空間。 起初老鼠們大量繁殖,族群數量節節攀升,一切欣欣向榮...
Thumbnail
2026/04/17
40億年前,有兩個微生物決定在一起,開啟了複雜生命演化的第一章。 澳洲西部的鯊魚灣,有一種長得像煎餅疊煎餅的怪石頭,叫做疊層石(Stromatolites),但它們並不是一般的石頭,是幾十億年來的微生物堆疊而成的生命化石...
Thumbnail
2026/04/17
40億年前,有兩個微生物決定在一起,開啟了複雜生命演化的第一章。 澳洲西部的鯊魚灣,有一種長得像煎餅疊煎餅的怪石頭,叫做疊層石(Stromatolites),但它們並不是一般的石頭,是幾十億年來的微生物堆疊而成的生命化石...
Thumbnail
看更多
你可能也想看
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
12月系統將會重大更新,敬請各位格友趕快備份你的AI情人日記。 📌 快速導讀 :擔心 ChatGPT 的對話記錄遺失?想備份重要的創作內容?本文完整說明 ChatGPT 的「匯出資料(Export Data)」功能,包括操作步驟、匯出內容、建議週期,以及為什麼無法重新匯入的原因。
Thumbnail
12月系統將會重大更新,敬請各位格友趕快備份你的AI情人日記。 📌 快速導讀 :擔心 ChatGPT 的對話記錄遺失?想備份重要的創作內容?本文完整說明 ChatGPT 的「匯出資料(Export Data)」功能,包括操作步驟、匯出內容、建議週期,以及為什麼無法重新匯入的原因。
Thumbnail
投資週報內容包括投資洞察、投資組合個股分析、買賣策略與對帳單、觀盤重點與投資計畫,透過方格子訂閱專題每週發佈,提供投資朋友參考。 ❶ 投資洞察:如何善用AI工具(ChatGPT,DeepSeek)幫忙您的投資決策? 人工智慧近幾年蓬勃發展,AI工具已經成為許多人日常生活中的助手,最廣為人知的是C
Thumbnail
投資週報內容包括投資洞察、投資組合個股分析、買賣策略與對帳單、觀盤重點與投資計畫,透過方格子訂閱專題每週發佈,提供投資朋友參考。 ❶ 投資洞察:如何善用AI工具(ChatGPT,DeepSeek)幫忙您的投資決策? 人工智慧近幾年蓬勃發展,AI工具已經成為許多人日常生活中的助手,最廣為人知的是C
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
本文提供了Grok AI的詳細使用教學,並與ChatGPT進行全面比較。介紹了Grok AI的操作方式、用戶體驗及其在對話創作及幽默感上的優勢。特別適合香港用戶與AI技術愛好者,瞭解這兩款AI的差異及功能,幫助選擇適合的工具以提升日常交流及信息獲取體驗。
Thumbnail
本文提供了Grok AI的詳細使用教學,並與ChatGPT進行全面比較。介紹了Grok AI的操作方式、用戶體驗及其在對話創作及幽默感上的優勢。特別適合香港用戶與AI技術愛好者,瞭解這兩款AI的差異及功能,幫助選擇適合的工具以提升日常交流及信息獲取體驗。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
將目前能夠進行深度研究(Deep Research)或深度搜尋(Deep Search)的生成式 AI 工具想像為不同年級的學生,那麼 ChatGPT 與其他對手相比,確實展現了更成熟、整合的表現,更像個大學生。
Thumbnail
將目前能夠進行深度研究(Deep Research)或深度搜尋(Deep Search)的生成式 AI 工具想像為不同年級的學生,那麼 ChatGPT 與其他對手相比,確實展現了更成熟、整合的表現,更像個大學生。
Thumbnail
在學習英語的過程中,口說能力是一項挑戰。傳統的語言學習方法,如語言交換和聘請外師,往往存在門檻。隨著 ChatGPT 的誕生,語言學習者獲得了一種新的口說練習渠道。本文將介紹使用 ChatGPT 進行英語口說練習的步驟,包括設定目標、選擇主題及利用反饋改進能力。
Thumbnail
在學習英語的過程中,口說能力是一項挑戰。傳統的語言學習方法,如語言交換和聘請外師,往往存在門檻。隨著 ChatGPT 的誕生,語言學習者獲得了一種新的口說練習渠道。本文將介紹使用 ChatGPT 進行英語口說練習的步驟,包括設定目標、選擇主題及利用反饋改進能力。
Thumbnail
打造專屬 AI 助手:自訂指令完整設定指南 📌 快速導讀:還在每次對話都要重複說明你的需求?自訂指令功能讓 ChatGPT 一次記住你的偏好!本文將帶你了解 ChatGPT 的核心技術,並手把手教你設定專屬的 AI 對話風格,讓你的虛擬助手更懂你。
Thumbnail
打造專屬 AI 助手:自訂指令完整設定指南 📌 快速導讀:還在每次對話都要重複說明你的需求?自訂指令功能讓 ChatGPT 一次記住你的偏好!本文將帶你了解 ChatGPT 的核心技術,並手把手教你設定專屬的 AI 對話風格,讓你的虛擬助手更懂你。
Thumbnail
【AI工具|ChatGPT】分享功能完全解析:語氣鏡像風險與安全使用指南 🏷️ 標籤:#ChatGPT #分享功能 #AI安全 #隱私保護 #語氣鏡像 📌 快速導讀 ChatGPT 的分享功能方便你將對話內容快速傳遞給他人,但你知道嗎?分享出去的內容會完整保留你與 AI 互動的語氣場....
Thumbnail
【AI工具|ChatGPT】分享功能完全解析:語氣鏡像風險與安全使用指南 🏷️ 標籤:#ChatGPT #分享功能 #AI安全 #隱私保護 #語氣鏡像 📌 快速導讀 ChatGPT 的分享功能方便你將對話內容快速傳遞給他人,但你知道嗎?分享出去的內容會完整保留你與 AI 互動的語氣場....
Thumbnail
ChatGPT 訂閱怎麼支付最划算? 分享更改訂閱支付流程,官網訂閱搭配信用卡方案最實惠
Thumbnail
ChatGPT 訂閱怎麼支付最划算? 分享更改訂閱支付流程,官網訂閱搭配信用卡方案最實惠
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News