從「解題機器」到「知識創造者」的跨越
人工智慧多半在「回答問題」的層次,無論是寫文案還是修程式碼,AI 扮演的是一個龐大資料庫的提取者,而非真理的探尋者。然而DeepMind 於 2026 年初推出的 AI 研究代理人「Aletheia」正在打破這道界線。
這不僅僅是一款更聰明的聊天機器人,而是一個真正的「AI 科學家」。當傳統 AI 還在學習如何模仿人類語言時,Aletheia 已經開始主動定義並解決人類尚未觸及的科學邊界。我們正處於科學革命的邊界:如果 AI 不再只是被動地從已知資料中尋找答案,而是開始自主「發明」新的知識,人類在科研領域的角色將發生翻天覆地的變化。這是一個「典範轉移」(Paradigm Shift)的時刻,AI 正在從工具進化為先驅。
高等數學或新的更艱深的數學不再是頂尖智慧人類的代表,AI也行。

突破點一:告別「拋光」的奧數,挑戰「混亂」的真實研究
在 Aletheia 出現之前,AI 在數學領域的巔峰多體現在國際數學奧林匹亞(IMO)競賽。然而,對資深分析師而言,競賽數學與真實科學研究之間存在著本質上的鴻溝。
競賽數學(IMO):
- 這些問題是被「磨光過的(polished)」。它們被保證一定有解,且解題路徑被限制在已知的範疇內。
真實科學研究:
- 現實世界的問題是混亂(messy)且充滿不確定性的。科研人員往往不知道一個問題是否有解,甚至連解題工具都尚未發明。
Aletheia 的突破在於它能從「已知領域」跨入「未知領域」。這種從「解決特定問題」到「探索問題空間」的進化,是通往通用人工智慧(AGI)最關鍵的一步。

突破點二:大腦過濾器與「幻覺殺手」!
Aletheia 的核心運作機制並非盲目算力輸出,而是精密的 生成器(Generator)與驗證器(Verifier) 循環。為了克服 AI 致命的「幻覺」缺陷,DeepMind 祭出了兩大技術絕招。

第一,「隱藏式思考路徑」:
Aletheia 使用自然語言(英文)進行自我檢查。為了防止 AI 「盲目同意自己」,研究人員將其「混亂的思考過程(Messy train of thought)」與最終答案分離,讓驗證器在不受思考過程干擾的情況下獨立評估結果,避免 AI 陷入自我欺騙。
第二,實時文獻檢索:
這正是 Aletheia 區別於其他模型的關鍵。它具備透過 Google 搜尋閱讀並結合數十篇頂尖研究論文的能力。這讓 AI 不再僅僅依賴訓練數據,而是能像人類科學家一樣查閱文獻,從中吸取最新技術,徹底消除了憑空捏造論文或作者的「胡說八道」。
「這本質上是一個過濾器... 讓 AI 不會隨意把未經證實的想法丟到以太網中。」
突破點三:100 倍效率躍升!為什麼「暴力破解」已成過去?
在 Aletheia 身上,我們看到了「推理效能(Inference-time scaling)」的質變。DeepMind 透過訓練一個「更強大的基礎模型」,讓 AI 的推理能力產生了非線性的提升。
能力躍遷:
- 在沒有網路連結的情況下,其解題成功率從原本的 65% 驚人地提升至 95%,輕鬆超越了以往的 IMO 金牌級 AI。
算力神蹟:
- 達到同樣的智力水準,Aletheia 所需的 計算量減少了 100 倍。
通往 AGI 的道路不只有堆疊算力,透過優化模型結構和推理邏輯,AI 可以用更少的資源思考得更深。這將讓高品質的科學研究不再局限於巨型實驗室,而是走向大眾。
突破點四:解決「艾狄胥猜想」,當 AI 填補人類視角的盲點
Aletheia 自主解決了 4 個由傳奇數學家保羅·艾狄胥留下的開放性數學難題。雖然這只佔數據庫中 700 個問題的 0.57%,但其戰略意義遠大於數字本身。
數學家指出,這 4 個問題雖然歷史悠久,但過去常被專家「忽略(obscured)」。「冷門並不代表容易(Obscurity does not equal difficulty)」,這正是 AI 的優勢所在,它不會感到枯燥,也不會受學術偏見影響,能全天候在人類忽略的冷門領域中探索。
Aletheia 與 Sakana AI 的「The AI Scientist」不同,它專注於純數學、邏輯與證明等抽象領域,展現 AI 創造新知識的能力,堪稱科學界的「萊特兄弟時刻」。
突破點五:A2 分級,重新定義 AI 的自主等級
為了讓學界對 AI 的貢獻有客觀的評估,DeepMind 提出了一個雙軸分級框架(類似自駕車分級),將「自主性(Autonomy)」與「新穎性(Novelty)」結合:

自主軸(Autonomy):
- 分為 H(人類主導)、C(協作)、A(本質上自主)。
新穎軸(Novelty/Significance):
- Level 0:可忽略。
- Level 1:輕微新穎。
- Level 2:具備可發表品質的研究成果。
- Level 3:重大進展。
- Level 4:里程碑突破(如費馬最後定理級別)。
Aletheia 已達 A2 級,可自主產出博士級論文內容。
迎接「人機混和」的科學大爆發時代
陶哲軒指出,我們正進入「人機混和研究」時代。人類將擔任高層次創意、方向定義和終極意義詮釋的角色,而 AI 則成為強大的力倍增器,負責邏輯驗證和海量路徑試錯。
未來 5 到 15 年,AI 將從「共同作者」演變為科學發現的主導者。AI 已證明它能創造人類未曾觸及的知識,我們正處於轉折點,思考它何時能帶領人類飛向知識的無盡邊界。















