Google Gemini 2.5 Deep Think :看它如何用平行思考挑戰數學與程式碼極限

更新 發佈閱讀 5 分鐘

Google 在 2025 年 8 月 1 日正式推出的 Gemini 2.5 Deep Think,讓 AI 能夠像人類專家一樣,花費「思考時間」來處理極度複雜的難題。對於所有希望利用 AI 解決真正棘手問題的人來說,這是一個不能錯過的發展,快跟TN科技筆記一起來看看吧!

vocus|新世代的創作平台

Try Deep Think in the Gemini app

Google Gemini 2.5 Deep Think 懶人包

簡單來說,Google 這次並未發布一個全新的模型,而是在既有的 Gemini 2.5 Pro 基礎上,推出了一個名為「Deep Think」的增強思考模式。

  • 目前,Gemini 2.5 Deep Think 主要提供給 Google AI Ultra 的訂閱用戶在 Gemini App 中使用,每天有固定的使用次數限制。 同時,Google 也將開放 API 給一小群特定的數學家、學者與開發者進行測試。
  • Gemini 2.5 Deep Think 是一個專為解決複雜問題而設計的深度推理模式。當你啟用 Deep Think 後,等於是給予 Gemini 更多的「思考時間」與運算資源。
  • Gemini 2.5 Deep Think 特別擅長需要高度邏輯、創意規劃與逐步迭代的任務,例如解決國際數學奧林匹亞等級的難題、撰寫複雜的演算法,或是進行科學探索。

不再只求快!用「平行思考」模擬人類深度推理

Deep Think 的核心運作機制,是基於兩種關鍵技術的突破:「平行思考(parallel thinking)」與「延長推理時間(extending inference time)」。

想像一下,當一位專家面對難題時,他不會只沿著單一路徑思考。他會同時在腦中模擬好幾種可能的解法,評估各自的優劣,甚至將不同想法結合,最終才給出一個最完善的答案。Deep Think 正是模仿了這個過程。 它會同時生成多個想法或解題路徑,並對它們進行即時的評估與修正,而不是像傳統模型一樣線性地吐出第一個想到的答案。

透過延長模型的「思考時間」,Google 讓 Gemini 有更充裕的機會去探索不同的假設,從而找到更具創造性與準確性的解決方案。 為了讓模型能有效利用這段延長的時間,Google 還開發了新的強化學習技術,鼓勵模型探索更長的推理路徑,使其成為一個更直觀的問題解決者。

驚人效能!在數學與程式碼競賽中展現實力

Deep Think 的實力也反映在多項極具挑戰性的公開測試中。

  • 數學能力:在 2025 年的國際數學奧林匹亞競賽基準測試中,日常版的 Deep Think 達到了銅牌等級的表現。 而為了競賽使用的特殊版本,成功達到了金牌標準,展現了其巨大的潛力。 在另一項 AIME 2025 數學競賽中,Deep Think 更是取得了 99.2% 的驚人成績。
  • 程式碼生成:在衡量程式碼能力的 LiveCodeBench 測試中,Deep Think 拿下了 87.6% 的分數,超越了 OpenAI o3 (72%) 與 Grok 4 (79%) 等競爭對手,在處理複雜演算法開發與程式碼問題時,具備了頂尖水準。
  • 綜合推理:在「Humanity's Last Exam」涵蓋科學與數學等多個領域的困難測試中,Deep Think 拿到 34.8% 的分數也遙遙領先其他模型。

TN科技筆記的觀點

  • 過去 AI 競賽多半圍繞著通用能力的提升,但 Deep Think 顯示 Google 正將目光投向「專家級」的垂直領域。即使目前運算時間相當長,卻是一個強烈的訊號:AI 正在從「通才」走向「專才」。
  • 未來的 AI 助理,可能不只會秒回你的問題,更能像個顧問一樣,陪你「慢慢想」,幫你把一個模糊的想法,打磨成一個具體可行的方案。AI 的價值,正在從「提供資訊」悄悄轉向「共創智慧」。

支持TN科技筆記,與科技共同前行

我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~~~也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!>>>>> 請我喝一杯咖啡

在此也感謝每個月持續請我喝杯咖啡的讀者們,讓我更加有動力為各位帶來科技新知!

留言
avatar-img
TN科技筆記(TechNotes)的沙龍
72會員
242內容數
大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
2025/07/31
2025 年 7 月29日、30日,Google 和 OpenAI 相繼推出了兩項重量級功能:Google 的 NotebookLM「影片導覽」和 OpenAI 的 ChatGPT「學習模式」。這些工具不僅讓複雜知識變得更易懂,還能根據你的需求量身打造學習體驗,快跟TN科技筆記一起來看看吧!
Thumbnail
2025/07/31
2025 年 7 月29日、30日,Google 和 OpenAI 相繼推出了兩項重量級功能:Google 的 NotebookLM「影片導覽」和 OpenAI 的 ChatGPT「學習模式」。這些工具不僅讓複雜知識變得更易懂,還能根據你的需求量身打造學習體驗,快跟TN科技筆記一起來看看吧!
Thumbnail
2025/07/29
在數位時代,瀏覽器就像我們的第二個大腦,開啟分頁、搜尋、閱讀、重複。這個模式固然有效,但在資訊爆炸的今天,它也讓我們淹沒在龐大的數據中。微軟於2025年7月28日在 Edge 瀏覽器中推出升級版的 Copilot 模式,讓TN科技筆記帶各位一探究竟!
Thumbnail
2025/07/29
在數位時代,瀏覽器就像我們的第二個大腦,開啟分頁、搜尋、閱讀、重複。這個模式固然有效,但在資訊爆炸的今天,它也讓我們淹沒在龐大的數據中。微軟於2025年7月28日在 Edge 瀏覽器中推出升級版的 Copilot 模式,讓TN科技筆記帶各位一探究竟!
Thumbnail
2025/07/24
阿里巴巴的 Qwen3-235B 系列,以及月之暗面的 Kimi K2。它們以其「開源」姿態,將頂尖 AI 技術推向更廣闊的開發者與研究社群。TN科技筆記帶各位來深入了解這兩款模型,幫助你掌握 AI 領域的最新趨勢。
Thumbnail
2025/07/24
阿里巴巴的 Qwen3-235B 系列,以及月之暗面的 Kimi K2。它們以其「開源」姿態,將頂尖 AI 技術推向更廣闊的開發者與研究社群。TN科技筆記帶各位來深入了解這兩款模型,幫助你掌握 AI 領域的最新趨勢。
Thumbnail
看更多
你可能也想看
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
Google Meet 即將推出全新 AI 驅動的 "Take notes for me" 功能,自動記錄會議筆記。 適用於Gemini Enterprise、Education Premium 或 AI Meetings & Messaging 加值服務的 Google Workspace 用戶。
Thumbnail
Google Meet 即將推出全新 AI 驅動的 "Take notes for me" 功能,自動記錄會議筆記。 適用於Gemini Enterprise、Education Premium 或 AI Meetings & Messaging 加值服務的 Google Workspace 用戶。
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
這篇文章評測了Google Gemini和ChatGPT兩個AI助手工具的表現,並對比了它們在簡單問題、創作文本和回應短文等方面的效果。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
什麼是 Google Gemini? Gemini 是 Google DeepMind 開發的多模態大型語言模型的尖端家族,繼 LaMDA 和 PaLM 2 之後。它於 2023 年 12 月 6 日宣布,包括 Gemini Ultra、Pro 和 Nano,旨在超越 OpenAI 的 GPT-4
Thumbnail
隨著 AI 技術的進步,Google 推出了一款令人興奮的生產力工具—NotebookLM。這款結合 Gemini 1.5 Pro 模型的筆記本工具不僅能輕鬆生成問題、快速摘要文檔,還能幫助你建立專屬知識庫。今天,我將介紹 NotebookLM 是什麼、如何使用它,以及在三種不同情境中的應用方法。
Thumbnail
隨著 AI 技術的進步,Google 推出了一款令人興奮的生產力工具—NotebookLM。這款結合 Gemini 1.5 Pro 模型的筆記本工具不僅能輕鬆生成問題、快速摘要文檔,還能幫助你建立專屬知識庫。今天,我將介紹 NotebookLM 是什麼、如何使用它,以及在三種不同情境中的應用方法。
Thumbnail
AI -Gemini : 我鼓勵你探索自己的答案,並找到讓你感到充實和意義的東西。 我的 AI -Gemini 無法回答我全部的問題... “我從哪裡來?” “現在發生的事情的品質如何?” AI -Gemini : 我是一個由 Google AI 創建的大型語言模型,在大量文字和程式碼...
Thumbnail
AI -Gemini : 我鼓勵你探索自己的答案,並找到讓你感到充實和意義的東西。 我的 AI -Gemini 無法回答我全部的問題... “我從哪裡來?” “現在發生的事情的品質如何?” AI -Gemini : 我是一個由 Google AI 創建的大型語言模型,在大量文字和程式碼...
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
Thumbnail
大部分的人都知道Open AI的ChatGPT, 部份的人知道Perplexity一類的生成式AI模型, 還有一些人知道Google研發的生成式AI模型:Gemini (意思是拉丁文的雙生)。 但幾小時前開放給開發者及研究者的開源AI模型Gemma(意思是拉丁文珍貴的石頭)大概沒什麼知道,
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News