📝📝：AI 生成的科學論文首度通過同行審查｜AI 科學家 v2 將導入加速科學界的研究

2025/03/28 更新2025/03/28 發佈閱讀 5 分鐘

由 Leonardo AI 生成

本文翻譯自日本 AI 新創公司 Sakana AI（サカナAI）的兩篇研究，分別是《The AI Scientist Generates its First Peer-Reviewed Scientific Publication》以及《The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery》

AI 與科學研究領域迎來了一個劃時代的時刻。

由 AI 科學家（The AI Scientist V2）完全生成的一篇論文成功通過了 2025 年國際學習表徵會議（International Conference on Learning Representations, ICLR）研討會的同行評審過程。

據開發者 Sakana.ai 所述，這是第一篇完全由 AI 生成並經過標準同行評審程序的論文，這項成就展現了 AI 在學術研究中的日益增強的能力，並引發了關於 AI 在科學發現中的未來角色的重要討論。

這篇論文是由 AI 科學家（The AI Scientist）的升級版本 — — AI 科學家 v2 所生成的。

本次實驗是在 ICLR 領導層、研討會組織者以及英屬哥倫比亞大學（University of British Columbia, UBC）機構審查委員會（IRB）的全力合作下進行的。

此研究不僅展示了 AI 生成研究的潛力，也強調了 AI 科學家在學術界接受度方面的倫理考量。

同行評審過程：AI vs. 人類研究

為了評估 AI 生成研究的品質，研究團隊向 ICLR 研討會提交了三篇完全由 AI 生成的論文。

評審員被告知可能有 AI 生成的論文，但並不知道自己審閱的論文是否由 AI 撰寫。AI 科學家 v2 負責整個研究過程，包括假設生成、實驗設計、程式執行、數據分析及論文撰寫，全程沒有任何人工干預，除了選定研究主題。

在提交的三篇 AI 生成論文中，有一篇獲得了超過接受門檻的評分，具體評分如下：

評分：6 略高於接受門檻（Marginally above acceptance threshold）
評分：7 優秀論文，應該接受（Good paper, accept）
評分：6 略高於接受門檻（Marginally above acceptance threshold）

這些評分使 AI 生成論文排名前 45%，高於研討會內許多人類撰寫並被接受的論文。然而，根據實驗協議，所有 AI 生成論文在發表前均被撤回，以維護研究的透明性與倫理性。

AI 科學家 v2 負責整個研究過程，包括假設生成、實驗設計、程式執行、數據分析及論文撰寫。由 Leonardo AI 生成

AI 科學家的倫理考量與透明度

這項研究引發了關於 AI 生成科學研究的倫理和程序性問題。

儘管 AI 科學家 v2 能夠達到同行評審標準，但科學界尚未決定是否應將 AI 生成的論文與人類撰寫的論文一同發表。透明度仍是關鍵，未來的討論應關注 AI 生成內容應如何揭露，以及應如何與人類撰寫的研究進行評比。

為了確保透明度，這些 AI 生成的論文未在 OpenReview 平台公開。

這一決策是由 ICLR 組織者、研討會領導者和研究團隊共同作出的，目的是避免 AI 生成論文在學術界尚未制定明確規範之前，對同行評審程序產生潛在影響。

AI 生成研究的挑戰與局限

儘管這項研究取得了突破性進展，但 AI 生成論文仍然存在一定的局限性。

獲得接受的論文是提交至研討會（seminar），而非 ICLR 主會議。主會議的接受率約為 20–30%，而研討會的接受率則約為 60–70%。這表明 AI 生成的研究仍需進一步提升，才能達到頂級學術會議的標準。

此外，人類研究團隊對 AI 生成的三篇論文進行了內部審查，結果顯示沒有一篇符合 ICLR 主會議的標準。AI 科學家還出現了一些錯誤，例如在引用部分誤將「LSTM 神經網絡」錯誤歸因於 Goodfellow（2016），而非正確的作者 Hochreiter 和 Schmidhuber（1997）。

另一個局限性在於 AI 科學家主要基於最先進的大型語言模型（LLM）。其表現直接取決於這些基礎模型的發展。如果未來基礎模型持續進步，那麼 AI 科學家的研究能力也將隨之提高。

AI 科學家在引用部分誤將「LSTM 神經網絡」錯誤歸因於 Goodfellow（2016）。來源：Sakana.ai

AI 在科學發現的未來

AI 科學家 v2 的成功代表了 AI 生成研究的一個重要進展，但這僅僅是開始。未來的 AI 研究助手可能能夠產出品質更高的論文，甚至達到人類研究員的水準，獲得頂級科學會議和權威期刊的認可。

最終目標並非用 AI 取代人類科學家，而是加速科學發現。

如果 AI 能夠產生並驗證新的研究成果，可能促成醫學、物理學等領域的重大突破。未來的關鍵問題不僅在於 AI 生成的研究能否通過同行評審，更在於這些 AI 驅動的發現如何促進人類知識的進步與福祉。

透過持續討論 AI 生成研究的透明性和倫理問題，科學界可以確保 AI 成為推動創新的工具，而非影響學術誠信的挑戰者。AI 科學的未來充滿潛力，在適當的指導下，將成為擴展人類知識疆界的重要夥伴。

留言

社會人的哲學沉思

192會員

346內容數

從物理到電機工程再轉到資訊傳播，最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、傳播理論、社會學、心理學、哲學游移；期盼有天無產階級可以推倒資本主義的高牆的兼職家教。

社會人的哲學沉思的其他內容

2025/04/25

📝📝：AI 正處於危險的幻覺｜認知科學家 Guillaume Thierry：我們需要停止人性化 AI

大型語言模型以自然的節奏說話，表達好奇心，甚至聲稱能體驗情感。但這精心打造的表象掩蓋了一個基本的事實：這些 AI 系統根本不具備這些人類特質。

2025/04/25

📝📝：AI 正處於危險的幻覺｜認知科學家 Guillaume Thierry：我們需要停止人性化 AI

2025/04/22

📝📝：馬來人、爪哇人、菲律賓人都很懶惰？｜「懶惰」的迷思隨著殖民政策延續至今的東南亞

「懶惰原住民」（the Lazy Native）的迷思並非自然形成，而是殖民當局帶著明確的意識形態意圖精心打造的。

2025/04/22

📝📝：馬來人、爪哇人、菲律賓人都很懶惰？｜「懶惰」的迷思隨著殖民政策延續至今的東南亞

「懶惰原住民」（the Lazy Native）的迷思並非自然形成，而是殖民當局帶著明確的意識形態意圖精心打造的。

2025/04/18

📝📝：未來的人類不再意識到 AI 的存在｜科技思想家 Kevin Kelly 對技術、AI 及其未來影響的見解

KK 指出，AI 的長期影響將超過電力與火的發明，但這個變革需要數百年來逐步展現。

2025/04/18

📝📝：未來的人類不再意識到 AI 的存在｜科技思想家 Kevin Kelly 對技術、AI 及其未來影響的見解

KK 指出，AI 的長期影響將超過電力與火的發明，但這個變革需要數百年來逐步展現。

#AI 的其他內容

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

好好宅在家

AI盛行下，我卻感受到「老派」設計的浪漫。

方格子 vocus 官方沙龍

【4月靈感產生器】TOP 100 關鍵字：「○○」格友最愛用

你可能也想看

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

背景：從冷門配角到市場主線，算力與電力被重新定價小P從2008進入股市，每一個時期的投資亮點都不同，記得2009蘋果手機剛上市，當時蘋果只要在媒體上提到哪一間供應鏈，隔天股價就有驚人的表現，當時光學鏡頭非常熱門，因為手機第一次搭上鏡頭可以拍照，也造就傳統相機廠的殞落，如今手機已經全面普及，題

#AI#算力#電力

2026/04/11

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

#AI#算力#電力

2026/04/11

米奇幻世界

人工智能：未來的新篇章

數位化時代中，人工智能（AI）已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性，並提出負責任地發展和使用AI的思考。

#挑戰#人工智能#責任

2024/03/12

米奇幻世界

人工智能：未來的新篇章

數位化時代中，人工智能（AI）已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性，並提出負責任地發展和使用AI的思考。

#挑戰#人工智能#責任

2024/03/12

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

Darren的沙龍

解密 AI 與資料科學 (一) : AI 開發鏈, 跨領域溝通 & 最具未來性的職業

本文談及資料科學的領域與分工。首先是建造一個AI的研發流程，資料收集到 AI 模型訓練的過程，AI經歷這一切流程被創造出來並產生價值；再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。

#人工智慧#AI#資料科學

2024/07/05

Darren的沙龍

解密 AI 與資料科學 (一) : AI 開發鏈, 跨領域溝通 & 最具未來性的職業

#人工智慧#AI#資料科學

2024/07/05

一二三的沙龍

探索書籍摘要的新領域：利用人類反饋的OpenAI研究

透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現，也象徵著未來人工智慧與人類知識互動的無限可能性。

#OpenAI#人工智慧#人類

2024/03/18

一二三的沙龍

探索書籍摘要的新領域：利用人類反饋的OpenAI研究

透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現，也象徵著未來人工智慧與人類知識互動的無限可能性。

#OpenAI#人工智慧#人類

2024/03/18

私大王牌教授 (私人大學ACE) feat. mr gary

使用AI論文工具進行文獻回顧與研究方法

這篇文章介紹瞭如何利用AI論文工具來提高研究生的論文閱讀效率以及寫作效率。透過Connected Papers、Scispace和Immersive Translate等AI工具，可以進行文獻回顧、段落摘要生成、Paraphrasing、APA格式生成以及論文對照翻譯

#論文#ispace#文獻

2024/04/25

私大王牌教授 (私人大學ACE) feat. mr gary

使用AI論文工具進行文獻回顧與研究方法

#論文#ispace#文獻

2024/04/25

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11