AI 不再模仿/學習人類智慧,當AI開始「發明」知識:DeepMind Aletheia

p53-avatar-img
發佈於科普
更新 發佈閱讀 6 分鐘

從「解題機器」到「知識創造者」的跨越

人工智慧多半在「回答問題」的層次,無論是寫文案還是修程式碼,AI 扮演的是一個龐大資料庫的提取者,而非真理的探尋者。然而DeepMind 於 2026 年初推出的 AI 研究代理人「Aletheia」正在打破這道界線。

這不僅僅是一款更聰明的聊天機器人,而是一個真正的「AI 科學家」。當傳統 AI 還在學習如何模仿人類語言時,Aletheia 已經開始主動定義並解決人類尚未觸及的科學邊界。我們正處於科學革命的邊界:如果 AI 不再只是被動地從已知資料中尋找答案,而是開始自主「發明」新的知識,人類在科研領域的角色將發生翻天覆地的變化。

這是一個「典範轉移」(Paradigm Shift)的時刻,AI 正在從工具進化為先驅

高等數學或新的更艱深的數學不再是頂尖智慧人類的代表,AI也行。
vocus|新世代的創作平台

突破點一:告別「拋光」的奧數,挑戰「混亂」的真實研究

在 Aletheia 出現之前,AI 在數學領域的巔峰多體現在國際數學奧林匹亞(IMO)競賽。然而,對資深分析師而言,競賽數學與真實科學研究之間存在著本質上的鴻溝。

競賽數學(IMO): 

  • 這些問題是被「磨光過的(polished)」。它們被保證一定有解,且解題路徑被限制在已知的範疇內。

真實科學研究: 

  • 現實世界的問題是混亂(messy)且充滿不確定性的。科研人員往往不知道一個問題是否有解,甚至連解題工具都尚未發明。

Aletheia 的突破在於它能從「已知領域」跨入「未知領域」。這種從「解決特定問題」到「探索問題空間」的進化,是通往通用人工智慧(AGI)最關鍵的一步。

vocus|新世代的創作平台

突破點二:大腦過濾器與「幻覺殺手」!

Aletheia 的核心運作機制並非盲目算力輸出,而是精密的 生成器(Generator)與驗證器(Verifier) 循環。為了克服 AI 致命的「幻覺」缺陷,DeepMind 祭出了兩大技術絕招。

vocus|新世代的創作平台

第一,「隱藏式思考路徑」

Aletheia 使用自然語言(英文)進行自我檢查。為了防止 AI 「盲目同意自己」,研究人員將其「混亂的思考過程(Messy train of thought)」與最終答案分離,讓驗證器在不受思考過程干擾的情況下獨立評估結果,避免 AI 陷入自我欺騙。

第二,實時文獻檢索

這正是 Aletheia 區別於其他模型的關鍵。它具備透過 Google 搜尋閱讀並結合數十篇頂尖研究論文的能力。這讓 AI 不再僅僅依賴訓練數據,而是能像人類科學家一樣查閱文獻,從中吸取最新技術,徹底消除了憑空捏造論文或作者的「胡說八道」。

「這本質上是一個過濾器... 讓 AI 不會隨意把未經證實的想法丟到以太網中。」


突破點三:100 倍效率躍升!為什麼「暴力破解」已成過去?

在 Aletheia 身上,我們看到了「推理效能(Inference-time scaling)」的質變。DeepMind 透過訓練一個「更強大的基礎模型」,讓 AI 的推理能力產生了非線性的提升。

能力躍遷

  • 在沒有網路連結的情況下,其解題成功率從原本的 65% 驚人地提升至 95%,輕鬆超越了以往的 IMO 金牌級 AI。

算力神蹟

  • 達到同樣的智力水準,Aletheia 所需的 計算量減少了 100 倍

通往 AGI 的道路不只有堆疊算力,透過優化模型結構和推理邏輯,AI 可以用更少的資源思考得更深。這將讓高品質的科學研究不再局限於巨型實驗室,而是走向大眾。


突破點四:解決「艾狄胥猜想」,當 AI 填補人類視角的盲點

Aletheia 自主解決了 4 個由傳奇數學家保羅·艾狄胥留下的開放性數學難題。雖然這只佔數據庫中 700 個問題的 0.57%,但其戰略意義遠大於數字本身。

數學家指出,這 4 個問題雖然歷史悠久,但過去常被專家「忽略(obscured)」。「冷門並不代表容易(Obscurity does not equal difficulty)」,這正是 AI 的優勢所在,它不會感到枯燥,也不會受學術偏見影響,能全天候在人類忽略的冷門領域中探索。

Aletheia 與 Sakana AI 的「The AI Scientist」不同,它專注於純數學、邏輯與證明等抽象領域,展現 AI 創造新知識的能力,堪稱科學界的「萊特兄弟時刻」。


突破點五:A2 分級,重新定義 AI 的自主等級

為了讓學界對 AI 的貢獻有客觀的評估,DeepMind 提出了一個雙軸分級框架(類似自駕車分級),將「自主性(Autonomy)」與「新穎性(Novelty)」結合:

vocus|新世代的創作平台

自主軸(Autonomy): 

  • 分為 H(人類主導)、C(協作)、A(本質上自主)

新穎軸(Novelty/Significance):

    • Level 0:可忽略。
    • Level 1:輕微新穎。
    • Level 2:具備可發表品質的研究成果。
    • Level 3:重大進展。
    • Level 4:里程碑突破(如費馬最後定理級別)。

Aletheia 已達 A2 級,可自主產出博士級論文內容。


迎接「人機混和」的科學大爆發時代

陶哲軒指出,我們正進入「人機混和研究」時代。人類將擔任高層次創意、方向定義和終極意義詮釋的角色,而 AI 則成為強大的力倍增器,負責邏輯驗證和海量路徑試錯。

未來 5 到 15 年,AI 將從「共同作者」演變為科學發現的主導者。AI 已證明它能創造人類未曾觸及的知識,我們正處於轉折點,思考它何時能帶領人類飛向知識的無盡邊界。

vocus|新世代的創作平台
留言
avatar-img
繁若星
12會員
42內容數
科學是解釋未知的浪漫,人類的可貴在於自知有未知。 這裡沒有框架,科學、文化觀察、音樂與想像自由交會。 理解世界的最終目的,從來不是知識本身,而是成為更好版本的自己。 讀書 | 科普 | 文化 一個滋養靈魂與擴展的地方
繁若星的其他內容
2026/01/12
整合了 2025 年發表於《Nature Medicine》的最新研究,探討身體活動(每日快走 30 分鐘)與阿茲海默症病理進展和臨床表現延緩的關聯,指出可透過減緩 tau 蛋白累積來影響病情。結合1997年與2003年的經典修女研究,認知儲備、腦血管健康和正向心理特質在預防症狀出現的關鍵作用。
Thumbnail
2026/01/12
整合了 2025 年發表於《Nature Medicine》的最新研究,探討身體活動(每日快走 30 分鐘)與阿茲海默症病理進展和臨床表現延緩的關聯,指出可透過減緩 tau 蛋白累積來影響病情。結合1997年與2003年的經典修女研究,認知儲備、腦血管健康和正向心理特質在預防症狀出現的關鍵作用。
Thumbnail
2025/12/21
探討生命運作的底層邏輯,生命如同一個「即時運算、會溝通、會取巧、會等待、會下注未來」的系統。透過解析生命的五大隱藏規則:組織、資訊、能量與物質、交互作用、演化,五個故事植物被啃食時釋放化學訊號求救、胚胎期微弱水流決定器官位置、寄生蟲「駭入」宿主細胞、同一指令產生不同結果、種子延遲發芽以賭注未來。
Thumbnail
2025/12/21
探討生命運作的底層邏輯,生命如同一個「即時運算、會溝通、會取巧、會等待、會下注未來」的系統。透過解析生命的五大隱藏規則:組織、資訊、能量與物質、交互作用、演化,五個故事植物被啃食時釋放化學訊號求救、胚胎期微弱水流決定器官位置、寄生蟲「駭入」宿主細胞、同一指令產生不同結果、種子延遲發芽以賭注未來。
Thumbnail
2025/11/20
NASA 正以前所未有的規模,動員遍佈太陽系的 12 種觀測設備,全面解析罕見的星際彗星 3I/ATLAS。本文深入探討為何觀測此彗星至關重要,介紹 NASA 使用的各種先進太空任務與設備,以及一般民眾如何透過 NASA 官方管道免費觀賞最新影像與影片,瞭解這難得一見的外星物質樣本。
Thumbnail
2025/11/20
NASA 正以前所未有的規模,動員遍佈太陽系的 12 種觀測設備,全面解析罕見的星際彗星 3I/ATLAS。本文深入探討為何觀測此彗星至關重要,介紹 NASA 使用的各種先進太空任務與設備,以及一般民眾如何透過 NASA 官方管道免費觀賞最新影像與影片,瞭解這難得一見的外星物質樣本。
Thumbnail
看更多
你可能也想看
Thumbnail
學習AI人工智慧需要數學嗎?答案是肯定的!本文用簡單易懂的比喻,說明導數在機器學習中的重要性,以及如何應用導數進行梯度下降等關鍵步驟,並提供學習資源與方向。
Thumbnail
學習AI人工智慧需要數學嗎?答案是肯定的!本文用簡單易懂的比喻,說明導數在機器學習中的重要性,以及如何應用導數進行梯度下降等關鍵步驟,並提供學習資源與方向。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
人類對於大腦運作方式的探索,從來沒有停歇過。今年(2025)10月,美國南加州大學(USC)的一項突破性成果,為人工智慧與神經科學之間架起了新的橋樑:研究團隊成功創造出能模擬生物腦神經化學反應的人工神經元,這不僅是材料科學和電子工程的一大飛躍,更是邁向更高效、更接近真實大腦學習機制的智能計算系統..
Thumbnail
人類對於大腦運作方式的探索,從來沒有停歇過。今年(2025)10月,美國南加州大學(USC)的一項突破性成果,為人工智慧與神經科學之間架起了新的橋樑:研究團隊成功創造出能模擬生物腦神經化學反應的人工神經元,這不僅是材料科學和電子工程的一大飛躍,更是邁向更高效、更接近真實大腦學習機制的智能計算系統..
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
這篇文章淺顯易懂地解釋了偏微分與梯度下降法在AI中的應用,以爬山為例,說明如何利用偏微分計算不同方向的變化率,以及梯度下降法如何幫助AI找到最佳解。
Thumbnail
這篇文章淺顯易懂地解釋了偏微分與梯度下降法在AI中的應用,以爬山為例,說明如何利用偏微分計算不同方向的變化率,以及梯度下降法如何幫助AI找到最佳解。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News