AI 不再模仿/學習人類智慧，當AI開始「發明」知識：DeepMind Aletheia

發佈於科普

2026/03/31 更新2026/03/30 發佈閱讀 6 分鐘

從「解題機器」到「知識創造者」的跨越

人工智慧多半在「回答問題」的層次，無論是寫文案還是修程式碼，AI 扮演的是一個龐大資料庫的提取者，而非真理的探尋者。然而DeepMind 於 2026 年初推出的 AI 研究代理人「Aletheia」正在打破這道界線。

這不僅僅是一款更聰明的聊天機器人，而是一個真正的「AI 科學家」。當傳統 AI 還在學習如何模仿人類語言時，Aletheia 已經開始主動定義並解決人類尚未觸及的科學邊界。我們正處於科學革命的邊界：如果 AI 不再只是被動地從已知資料中尋找答案，而是開始自主「發明」新的知識，人類在科研領域的角色將發生翻天覆地的變化。

這是一個「典範轉移」（Paradigm Shift）的時刻，AI 正在從工具進化為先驅。

高等數學或新的更艱深的數學不再是頂尖智慧人類的代表，AI也行。

突破點一：告別「拋光」的奧數，挑戰「混亂」的真實研究

在 Aletheia 出現之前，AI 在數學領域的巔峰多體現在國際數學奧林匹亞（IMO）競賽。然而，對資深分析師而言，競賽數學與真實科學研究之間存在著本質上的鴻溝。

競賽數學（IMO）：

這些問題是被「磨光過的（polished）」。它們被保證一定有解，且解題路徑被限制在已知的範疇內。

真實科學研究：

現實世界的問題是混亂（messy）且充滿不確定性的。科研人員往往不知道一個問題是否有解，甚至連解題工具都尚未發明。

Aletheia 的突破在於它能從「已知領域」跨入「未知領域」。這種從「解決特定問題」到「探索問題空間」的進化，是通往通用人工智慧（AGI）最關鍵的一步。

突破點二：大腦過濾器與「幻覺殺手」！

Aletheia 的核心運作機制並非盲目算力輸出，而是精密的 生成器（Generator）與驗證器（Verifier） 循環。為了克服 AI 致命的「幻覺」缺陷，DeepMind 祭出了兩大技術絕招。

第一，「隱藏式思考路徑」：

Aletheia 使用自然語言（英文）進行自我檢查。為了防止 AI 「盲目同意自己」，研究人員將其「混亂的思考過程（Messy train of thought）」與最終答案分離，讓驗證器在不受思考過程干擾的情況下獨立評估結果，避免 AI 陷入自我欺騙。

第二，實時文獻檢索：

這正是 Aletheia 區別於其他模型的關鍵。它具備透過 Google 搜尋閱讀並結合數十篇頂尖研究論文的能力。這讓 AI 不再僅僅依賴訓練數據，而是能像人類科學家一樣查閱文獻，從中吸取最新技術，徹底消除了憑空捏造論文或作者的「胡說八道」。

「這本質上是一個過濾器... 讓 AI 不會隨意把未經證實的想法丟到以太網中。」

突破點三：100 倍效率躍升！為什麼「暴力破解」已成過去？

在 Aletheia 身上，我們看到了「推理效能（Inference-time scaling）」的質變。DeepMind 透過訓練一個「更強大的基礎模型」，讓 AI 的推理能力產生了非線性的提升。

能力躍遷：

在沒有網路連結的情況下，其解題成功率從原本的 65% 驚人地提升至 95%，輕鬆超越了以往的 IMO 金牌級 AI。

算力神蹟：

達到同樣的智力水準，Aletheia 所需的 計算量減少了 100 倍。

通往 AGI 的道路不只有堆疊算力，透過優化模型結構和推理邏輯，AI 可以用更少的資源思考得更深。這將讓高品質的科學研究不再局限於巨型實驗室，而是走向大眾。

突破點四：解決「艾狄胥猜想」，當 AI 填補人類視角的盲點

Aletheia 自主解決了 4 個由傳奇數學家保羅·艾狄胥留下的開放性數學難題。雖然這只佔數據庫中 700 個問題的 0.57%，但其戰略意義遠大於數字本身。

數學家指出，這 4 個問題雖然歷史悠久，但過去常被專家「忽略（obscured）」。「冷門並不代表容易（Obscurity does not equal difficulty）」，這正是 AI 的優勢所在，它不會感到枯燥，也不會受學術偏見影響，能全天候在人類忽略的冷門領域中探索。

Aletheia 與 Sakana AI 的「The AI Scientist」不同，它專注於純數學、邏輯與證明等抽象領域，展現 AI 創造新知識的能力，堪稱科學界的「萊特兄弟時刻」。

突破點五：A2 分級，重新定義 AI 的自主等級

為了讓學界對 AI 的貢獻有客觀的評估，DeepMind 提出了一個雙軸分級框架（類似自駕車分級），將「自主性（Autonomy）」與「新穎性（Novelty）」結合：

自主軸（Autonomy）：

分為 H（人類主導）、C（協作）、A（本質上自主）。

新穎軸（Novelty/Significance）：

- Level 0：可忽略。
- Level 1：輕微新穎。
- Level 2：具備可發表品質的研究成果。
- Level 3：重大進展。
- Level 4：里程碑突破（如費馬最後定理級別）。

Aletheia 已達 A2 級，可自主產出博士級論文內容。

迎接「人機混和」的科學大爆發時代

陶哲軒指出，我們正進入「人機混和研究」時代。人類將擔任高層次創意、方向定義和終極意義詮釋的角色，而 AI 則成為強大的力倍增器，負責邏輯驗證和海量路徑試錯。

未來 5 到 15 年，AI 將從「共同作者」演變為科學發現的主導者。AI 已證明它能創造人類未曾觸及的知識，我們正處於轉折點，思考它何時能帶領人類飛向知識的無盡邊界。

留言

繁若星

12會員

42內容數

科學是解釋未知的浪漫，人類的可貴在於自知有未知。這裡沒有框架，科學、文化觀察、音樂與想像自由交會。理解世界的最終目的，從來不是知識本身，而是成為更好版本的自己。讀書 | 科普 | 文化一個滋養靈魂與擴展的地方

繁若星的其他內容

2026/01/12

阿茲海默症請離開｜從修女研究到 Nature Medicine，科學如何幫大腦撐久一點

整合了 2025 年發表於《Nature Medicine》的最新研究，探討身體活動（每日快走 30 分鐘）與阿茲海默症病理進展和臨床表現延緩的關聯，指出可透過減緩 tau 蛋白累積來影響病情。結合1997年與2003年的經典修女研究，認知儲備、腦血管健康和正向心理特質在預防症狀出現的關鍵作用。

2026/01/12

阿茲海默症請離開｜從修女研究到 Nature Medicine，科學如何幫大腦撐久一點

2025/12/21

生命到底怎麼「想事情」？五個顛覆觀念的生物學真相與故事

探討生命運作的底層邏輯，生命如同一個「即時運算、會溝通、會取巧、會等待、會下注未來」的系統。透過解析生命的五大隱藏規則：組織、資訊、能量與物質、交互作用、演化，五個故事植物被啃食時釋放化學訊號求救、胚胎期微弱水流決定器官位置、寄生蟲「駭入」宿主細胞、同一指令產生不同結果、種子延遲發芽以賭注未來。

2025/12/21

生命到底怎麼「想事情」？五個顛覆觀念的生物學真相與故事

2025/11/20

NASA 全力觀測星際彗星 3I/ATLAS：罕見外星訪客的太陽系全景紀錄

NASA 正以前所未有的規模，動員遍佈太陽系的 12 種觀測設備，全面解析罕見的星際彗星 3I/ATLAS。本文深入探討為何觀測此彗星至關重要，介紹 NASA 使用的各種先進太空任務與設備，以及一般民眾如何透過 NASA 官方管道免費觀賞最新影像與影片，瞭解這難得一見的外星物質樣本。

2025/11/20

NASA 全力觀測星際彗星 3I/ATLAS：罕見外星訪客的太陽系全景紀錄

看更多

你可能也想看

溫蒂的夢幻島航海日誌

🤖 【資料科學的數學基礎課｜第9課】想學AI，為什麼要會微積分？中學生也能懂的導數入門

學習AI人工智慧需要數學嗎？答案是肯定的！本文用簡單易懂的比喻，說明導數在機器學習中的重要性，以及如何應用導數進行梯度下降等關鍵步驟，並提供學習資源與方向。

#商業#數據#學習

2025/08/06

溫蒂的夢幻島航海日誌

🤖 【資料科學的數學基礎課｜第9課】想學AI，為什麼要會微積分？中學生也能懂的導數入門

#商業#數據#學習

2025/08/06

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11

思潮

科學家打造能思考的人腦晶片

人類對於大腦運作方式的探索，從來沒有停歇過。今年（2025）10月，美國南加州大學（USC）的一項突破性成果，為人工智慧與神經科學之間架起了新的橋樑：研究團隊成功創造出能模擬生物腦神經化學反應的人工神經元，這不僅是材料科學和電子工程的一大飛躍，更是邁向更高效、更接近真實大腦學習機制的智能計算系統..

#人工智慧#神經元#大腦

2025/10/30