【AI 框架 03】AI模型驗證的迷思與侷限：「為什麼有效」？

Joe Yuan

發佈於AI 框架

2026/04/05 更新2026/04/05 發佈閱讀 3 分鐘

前言

上一篇，我們談到了 M = i × e 這個公式的誕生。

那之後，我沒有停留在公式上太久。我想驗證它。

實作出來了

實驗的早期並不順利。

當時使用的是一個只有 3B 參數的小型模型。對於小模型來說，這本來就是一場勝算不高的實驗——它的底子薄，容錯空間小，稍微偏一點輸出就崩了。果然，早期的回答經常答非所問，輸出混亂，有時候甚至讓人不確定它到底有沒有在理解問題。

我能做的就是把那些回答丟給 AI，問它哪裡出了問題，然後根據指引修正框架設計。

就這樣一版一版地疊。每一版都在上一版的問題上做修正，沒有跳躍，也沒有捷徑。

慢慢地，回答變得有條理了。幾乎每個問題都能答在點上。訓練資料不多，前前後後大概就兩三千筆，但結果比預期好。讓我有點意外的是，這個量級的資料，居然能讓一個小模型的行為產生這麼明顯的位移。

兩個問題

結果有效，但我反而開始困惑。

第一個問題是方法論的：每次看到問題、根據指引修正——這樣的過程，還算是真正的驗證嗎？我們設計了 200 道測試題，題目和訓練資料完全沒有重疊，都是模型從來沒見過的問題。但問題在於，修正的方向本身是 AI 給的。這讓整件事的邊界變得模糊：到底是框架在引導 AI，還是 AI 在引導框架？

這個問題我沒辦法乾淨地回答。

第二個問題更深，也更難甩掉：它的確變好了，但我說不清楚為什麼。

不是「大概是因為訓練資料品質好」那種說不清楚，而是更根本的——這個改善，究竟發生在哪一層？是框架設計本身在起作用，還是 LoRA 微調的參數更新剛好碰對了某個方向，還是兩件事湊在一起才有的結果？這三種解釋，我都無法排除，也無法確認。

這兩個問題方向相反，卻同時壓著我。

停在這裡

在某個時間點，我決定不再往裡面投入了。

不是放棄，是判斷投入產出比。那個「為什麼有效」的問題，想要回答它，需要的資源、算力、對照組設計，都遠超過我當時能調動的範圍。即便繼續做，頂多是多幾筆數據，問題的核心仍然會懸在那裡。死死纏著，不划算。

更現實的是：這個問題或許根本不在這個層次能被解答。

但問題本身沒有消失。它只是換了一個位置。

結論

我理解 AI 的本質是機率預測系統。LoRA 實驗告訴我行為可以被塑造，但塑造的過程仍然是黑盒子——還是在調機率分佈，只是調得比較準。

我想的是另一件事：即便 AI 的輸出來自機率，能不能讓它在機率之外，透過純數學運算自己算出判斷？

不是猜出來的，是算出來的。

這個念頭，把我帶向了更底層的方向。下一篇，我們再來談這件事。

含 AI 應用內容

留言

Joe 的隨手筆記

1會員

8內容數

用自己的方式，探討自己觀察到的事物。

#AI 的其他內容

出鞘的雙面刃：AI

目前共 17572 篇

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

好好宅在家

AI盛行下，我卻感受到「老派」設計的浪漫。

方格子 vocus 官方沙龍

【4月靈感產生器】TOP 100 關鍵字：「○○」格友最愛用

你可能也想看

邱吉爾的沙龍

100個AI指令優化SEO與內容營銷指南

本指南提供100個AI驅動的指令，涵蓋SEO關鍵詞研究、內容生成、數據分析、多平臺適配及用戶意圖解析，旨在協助營銷人員、內容創作者與SEO專家提升工作效率與成效。指令分為五大類別，並附帶實際應用範例及工具建議，

2025/10/17

2025/10/17

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

背景：從冷門配角到市場主線，算力與電力被重新定價小P從2008進入股市，每一個時期的投資亮點都不同，記得2009蘋果手機剛上市，當時蘋果只要在媒體上提到哪一間供應鏈，隔天股價就有驚人的表現，當時光學鏡頭非常熱門，因為手機第一次搭上鏡頭可以拍照，也造就傳統相機廠的殞落，如今手機已經全面普及，題

#AI#算力#電力

2026/04/11

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

#AI#算力#電力

2026/04/11

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

《轉轉生》（Re:INCARNATION）為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，結合拉各斯街頭節奏、Afrobeat／Afrobeats、以及約魯巴宇宙觀的非線性時間，建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發，解析其去殖民的身體政治。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11

PassiveSpark被動收入課程啟發系統

🌐 別人下班在追劇，他每月被動進帳8萬：一個台灣上班族把內容變「印鈔機」的真實故事

內容不是產出，而是長期滾動的數位資產「為什麼我這麼努力，存款還是只有五位數？」這是林先生連續第三年在年終檢視財務狀況時，內心最大的疑問。身為台北某科技公司的資深專員，月薪5萬5，看似不差，但扣掉房租1萬8、生活費、孝親費，每個月能存下來的不到1萬5。按照這個速度，光是頭期款就要存10年。

#數位資產#AI內容創作#被動收入

2025/10/30

PassiveSpark被動收入課程啟發系統

🌐 別人下班在追劇，他每月被動進帳8萬：一個台灣上班族把內容變「印鈔機」的真實故事

#數位資產#AI內容創作#被動收入

2025/10/30

軟式生活｜AI x Business x Design

軟式生活｜2026 年 SEO 完整指南：SEO、AEO、GEO 三大策略讓 AI Overview 引用你的內容

本文是軟式生活2026 年 SEO 完整指南：掌握 SEO、AEO、GEO 三大策略。Google AI Overviews 出現在 50% 搜尋結果，學習 E-E-A-T 信號、FAQ Schema 實施教學，讓 AI 引用你的內容，包含數據增加 22% 可見性，跨平台策略提升 2.8 倍引用率。

#2026年SEO#Threads#品牌

2026/02/07