📝📝:AI 生成的科學論文首度通過同行審查|AI 科學家 v2 將導入加速科學界的研究

更新 發佈閱讀 5 分鐘
由 Leonardo AI 生成

由 Leonardo AI 生成



本文翻譯自日本 AI 新創公司 Sakana AI(サカナAI)的兩篇研究,分別是《The AI Scientist Generates its First Peer-Reviewed Scientific Publication》以及《The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery


AI 與科學研究領域迎來了一個劃時代的時刻。

由 AI 科學家(The AI Scientist V2)完全生成的一篇論文成功通過了 2025 年國際學習表徵會議(International Conference on Learning Representations, ICLR)研討會的同行評審過程。

據開發者 Sakana.ai 所述,這是第一篇完全由 AI 生成並經過標準同行評審程序的論文,這項成就展現了 AI 在學術研究中的日益增強的能力,並引發了關於 AI 在科學發現中的未來角色的重要討論。

這篇論文是由 AI 科學家(The AI Scientist)的升級版本 — — AI 科學家 v2 所生成的。




本次實驗是在 ICLR 領導層、研討會組織者以及英屬哥倫比亞大學(University of British Columbia, UBC)機構審查委員會(IRB)的全力合作下進行的。

此研究不僅展示了 AI 生成研究的潛力,也強調了 AI 科學家在學術界接受度方面的倫理考量。


同行評審過程:AI vs. 人類研究

為了評估 AI 生成研究的品質,研究團隊向 ICLR 研討會提交了三篇完全由 AI 生成的論文。

評審員被告知可能有 AI 生成的論文,但並不知道自己審閱的論文是否由 AI 撰寫。AI 科學家 v2 負責整個研究過程,包括假設生成、實驗設計、程式執行、數據分析及論文撰寫,全程沒有任何人工干預,除了選定研究主題。

在提交的三篇 AI 生成論文中,有一篇獲得了超過接受門檻的評分,具體評分如下:

  • 評分:6 略高於接受門檻(Marginally above acceptance threshold)
  • 評分:7 優秀論文,應該接受(Good paper, accept)
  • 評分:6 略高於接受門檻(Marginally above acceptance threshold)


這些評分使 AI 生成論文排名前 45%,高於研討會內許多人類撰寫並被接受的論文。然而,根據實驗協議,所有 AI 生成論文在發表前均被撤回,以維護研究的透明性與倫理性。

AI 科學家 v2 負責整個研究過程,包括假設生成、實驗設計、程式執行、數據分析及論文撰寫。由 Leonardo AI 生成

AI 科學家 v2 負責整個研究過程,包括假設生成、實驗設計、程式執行、數據分析及論文撰寫。由 Leonardo AI 生成


AI 科學家的倫理考量與透明度

這項研究引發了關於 AI 生成科學研究的倫理和程序性問題。

儘管 AI 科學家 v2 能夠達到同行評審標準,但科學界尚未決定是否應將 AI 生成的論文與人類撰寫的論文一同發表。透明度仍是關鍵,未來的討論應關注 AI 生成內容應如何揭露,以及應如何與人類撰寫的研究進行評比。

為了確保透明度,這些 AI 生成的論文未在 OpenReview 平台公開。

這一決策是由 ICLR 組織者、研討會領導者和研究團隊共同作出的,目的是避免 AI 生成論文在學術界尚未制定明確規範之前,對同行評審程序產生潛在影響。



AI 生成研究的挑戰與局限

儘管這項研究取得了突破性進展,但 AI 生成論文仍然存在一定的局限性。

獲得接受的論文是提交至研討會(seminar),而非 ICLR 主會議。主會議的接受率約為 20–30%,而研討會的接受率則約為 60–70%。這表明 AI 生成的研究仍需進一步提升,才能達到頂級學術會議的標準。

此外,人類研究團隊對 AI 生成的三篇論文進行了內部審查,結果顯示沒有一篇符合 ICLR 主會議的標準。AI 科學家還出現了一些錯誤,例如在引用部分誤將「LSTM 神經網絡」錯誤歸因於 Goodfellow(2016),而非正確的作者 Hochreiter 和 Schmidhuber(1997)。

另一個局限性在於 AI 科學家主要基於最先進的大型語言模型(LLM)。其表現直接取決於這些基礎模型的發展。如果未來基礎模型持續進步,那麼 AI 科學家的研究能力也將隨之提高。

AI 科學家在引用部分誤將「LSTM 神經網絡」錯誤歸因於 Goodfellow(2016)。來源:Sakana.ai

AI 科學家在引用部分誤將「LSTM 神經網絡」錯誤歸因於 Goodfellow(2016)。來源:Sakana.ai





AI 在科學發現的未來

AI 科學家 v2 的成功代表了 AI 生成研究的一個重要進展,但這僅僅是開始。未來的 AI 研究助手可能能夠產出品質更高的論文,甚至達到人類研究員的水準,獲得頂級科學會議和權威期刊的認可。

最終目標並非用 AI 取代人類科學家,而是加速科學發現

如果 AI 能夠產生並驗證新的研究成果,可能促成醫學、物理學等領域的重大突破。未來的關鍵問題不僅在於 AI 生成的研究能否通過同行評審,更在於這些 AI 驅動的發現如何促進人類知識的進步與福祉

透過持續討論 AI 生成研究的透明性和倫理問題,科學界可以確保 AI 成為推動創新的工具,而非影響學術誠信的挑戰者。AI 科學的未來充滿潛力,在適當的指導下,將成為擴展人類知識疆界的重要夥伴。








留言
avatar-img
社會人的哲學沉思
192會員
346內容數
從物理到電機工程再轉到資訊傳播,最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、傳播理論、社會學、心理學、哲學游移;期盼有天無產階級可以推倒資本主義的高牆的兼職家教。
2025/04/25
大型語言模型以自然的節奏說話,表達好奇心,甚至聲稱能體驗情感。但這精心打造的表象掩蓋了一個基本的事實: 這些 AI 系統根本不具備這些人類特質。
Thumbnail
2025/04/25
大型語言模型以自然的節奏說話,表達好奇心,甚至聲稱能體驗情感。但這精心打造的表象掩蓋了一個基本的事實: 這些 AI 系統根本不具備這些人類特質。
Thumbnail
2025/04/22
「懶惰原住民」(the Lazy Native)的迷思並非自然形成,而是殖民當局帶著明確的意識形態意圖精心打造的。
Thumbnail
2025/04/22
「懶惰原住民」(the Lazy Native)的迷思並非自然形成,而是殖民當局帶著明確的意識形態意圖精心打造的。
Thumbnail
2025/04/18
KK 指出,AI 的長期影響將超過電力與火的發明,但這個變革需要數百年來逐步展現。
Thumbnail
2025/04/18
KK 指出,AI 的長期影響將超過電力與火的發明,但這個變革需要數百年來逐步展現。
Thumbnail
看更多
你可能也想看
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
這篇文章介紹瞭如何利用AI論文工具來提高研究生的論文閱讀效率以及寫作效率。透過Connected Papers、Scispace和Immersive Translate等AI工具,可以進行文獻回顧、段落摘要生成、Paraphrasing、APA格式生成以及論文對照翻譯
Thumbnail
這篇文章介紹瞭如何利用AI論文工具來提高研究生的論文閱讀效率以及寫作效率。透過Connected Papers、Scispace和Immersive Translate等AI工具,可以進行文獻回顧、段落摘要生成、Paraphrasing、APA格式生成以及論文對照翻譯
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
本文介紹了AI科研文獻管理工具,包括Connected Papers、EasyScholar、Research Rabbit、ReadPaper、立理 LitLit、海鯨AI學術、pdftopdf.ai等。這些工具能幫助科研人員實現高效的文獻管理和利用文獻資源,並提高科研工作的效率和質量。
Thumbnail
本文介紹了AI科研文獻管理工具,包括Connected Papers、EasyScholar、Research Rabbit、ReadPaper、立理 LitLit、海鯨AI學術、pdftopdf.ai等。這些工具能幫助科研人員實現高效的文獻管理和利用文獻資源,並提高科研工作的效率和質量。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News