GPT 5.1 我喜歡

更新 發佈閱讀 7 分鐘

各位 AI365 的好朋友們,週末愉快!哎呀,我本來今天是想要一早錄音,但是睡到太晚,只好等到ITS AI國際認證課程上完課,回到家吃飽飯,再來錄音。結果你知道嗎?今天的學員裡面居然有一位高手,她叫做Vivian,是一位節目主持人,她聽過前幾集的錄音之後,很溫暖的給我鼓勵勒,真是太感動了,讓楊老師在這條漫長的路上,又多了一些前進的動力,真的就感心啊,好的,加油,那就讓我們開始今天的分享吧 ~

這幾天大家一定有注意到一個新聞,就是GPT 5.1終於推出來了。有人說,GPT 5.1 好像更好聊了捏,不會太嚴肅,最重要的,該快的時候會快,該慢慢回答的時候,他也會深思熟慮之後,再跟我講答案。他好像越來越像是一個有智慧、而且是有很好EQ的人了。

AI365 GPT 5.1有什麼厲害之處?

AI365 GPT 5.1有什麼厲害之處?

那麼,GPT5.1相較於前一版本的GPT5,到底有什麼厲害的地方呢?楊老師整理成三點,讓大家在週末晚上也能輕鬆掌握最新的知識喔

首先,GPT 5.1 他升級了核心,他學會了「動態分配思考資源」。如果是相對簡單的任務,他就用簡單快速的模型 (Instant) 加速搞定;啊如果遇到要徹底思考,相對較複雜的難題,他就啟動 Thinking 模式深度思考,滿足你對深入問答品質的期待。這讓整體運算效率有了驚人的提升!

根據一家知名的資產管理公司 Balyasny 測試發現,GPT-5.1 的運行速度比 GPT-5 快了 2 到 3 倍!另外也有一家保險公司 Pace 也指出,他們的 AI 代理運行速度比 GPT-5 快了 50%,同時準確度更高。有人去測試喔,當 GPT5.1 在處理簡單的程式碼問題時,他用中等思考模式,只需約 2 秒 ,耗費 50 個 Token 就能回答問題,而前一代的 GPT-5,一樣用中等思考模式時,則需要約 10 秒 和 250 個 Token。這代表在簡單任務上,運算資源消耗直接銳減了 80%,那就是說,更快且更省錢囉,這對於需要執行大量任務企業來說,是非常重要的!

有動態調整資源耗用的能力,是不是很像我們在日常生活中,跟好朋友聊天時可以快速回應不經大腦,跟老闆做報告時,會繃緊神經,深怕講錯話,我們的腦袋會自動因應情境調整資源,避免長期緊繃、過度消耗能量,更要避免在正式場合,講出沒有經過大腦思考的答案。大家想想,我們人類從小就學會要長眼,要看場合說話,現在,連 AI 機器人 GPT 5.1 也學會了。

再來,第二點,在特定知識領域做到極致完美

例如:金融和法律,都是對精確度要求很高的領域,GPT-5.1 證明了他的推理引擎所向無敵。他已經不止是「聰明」,而且達到「可信賴」的企業級標準。

來看看數據喔,在法律 AI 平台 LegalOn 的評估測試結果中,GPT-5.1 在修訂合約的準確性方面,比 GPT-5.0 有 67% 的機率表現更好,這意味著他產生更優質法律修訂版本的可能性,多出了一倍以上!

同時,頂尖的法律 AI 平台 Harvey,也用嚴苛的 BigLaw Bench 來評估這個新模型,給出有史以來的最高分91.8分。還不止如此,GPT5.1還在所有的合約審查任務中,處理速度加快了大約 30%!那就是說,他在這麼敏感的領域中,他可以將法務任務做得又快又好。

我想OpenAI的Sam Altman是想跟大家說,他們家的 GPT-5.1 已經準備好處理那些「不能出錯」的核心專業任務了!

然後,我們再來看GPT 5.1厲害的第三點,這也是我最期待的

他全力擁抱AI Agent,並且讓寫程式的軟體工程師可以啟用「無推理」模式,這讓模型在對延遲敏感的工具調用任務中,比前一個版本的最小推理模式提升了 20%。這對於需要快速呼叫外部工具或 API 的 AI 來說是非常至關重要的關鍵!

然後,GPT-5.1 的記憶能力也大幅進步了,他有一種「擴展提示快取」的能力,可以將對話上下文保留長達 24 小時,就像給了 AI 一個超長的「記憶體」,讓它在長時間的互動中,後續請求能夠重複利用快取出上下文的關聯及對話邏輯,並且沒有太多了延遲,也降低了成本。

並且,GPT-5.1 還有一種可以用來更可靠地編輯程式碼的工具,叫做 apply_patch。還有一個 shell 命令工具,讓模型執行 shell 指令。這也意味著 AI 模型可以從「建議者」轉變為「執行者」。這將極大加速自主軟體開發流程,讓 AI 能夠在更少的干預下,自主地規劃、執行、除錯和修補程式碼。

我想,接下來,程式設計師們可以更容易寫出又快又好的Agent了。

好啦,最後,楊老師想幫大家整理三點 Takeaways,讓大家帶回去作紀念

第一,GPT 新版的 5.1,把 LLM 的發展帶到另外一個境界,他跟其他競爭者不一樣,不只是一味的追求「聰明智商高」,更在幫我們探詢一個在「聰明、高效率及方便使用」三者之間的黃金平衡。他給我們六種不同的對話語氣與風格體驗,讓我們使用者感受到他的可塑性,變成一個溫暖又可靠的對話夥伴。

第二,他要讓企業在大規模部署AI的時候,能夠更省錢,能夠根據任務的複雜程度去調配,去精準控制每次查詢的計算資源消耗,這是企業最關心的 AI 營運成本透明化,以及成本可預測性。這一點很重要,從2C走向2B的深水區,是必然的商模轉型,如果成功的話,OpenAI離公開發行就更近一步了。

第三,GPT-5.1 提供給大家 apply_patch 和 shell 兩個工具,這就表示著他正在從「只在旁邊提供建議」轉變為「可以獨當一面去執行」,這是關鍵的角色轉變,也是大家所期待的AI Agent加速開發,也讓 AI 能夠在更少的干預下,自主地規劃、執行、甚至做到除錯和修補程式碼。

聽到這裡,楊老師請大家打開手機去試試 GPT 5,1,打開電腦去試試 GPT 5,1,感受他可能帶來,給我們自己競爭力提升,和給公司順利轉型的機會,然後走得比別人再快一些,我們一起努力。


留言
avatar-img
楊老師AI365 | 生成式AI職場應用
94會員
77內容數
歡迎來到楊老師的生成式AI沙龍!這裡輕鬆帶你掌握GenAI的基礎概念,透過生活化案例幫助你了解AI如何影響工作與創造價值。我也會分享多年教學與輔導經驗,帶你掌握AI國際認證的考試技巧與學習心法。更重要的是,從教育、美容、製造、銷售等百工百業出發,帶你一步步認識各行各業如何實際導入AI,成為這波數位轉型浪潮中的領航者!
2025/11/14
介紹台大王鈺強教授團隊開發的AI技術 Receler,一種能讓AI繪圖模型「聽話」的「AI橡皮擦」,能以極小的參數,精準、有成本效益地從模型中刪除如限制級內容、血腥暴力等危險概念,同時保持模型的整體創作能力。它具備「穩健性」和「局部性」兩大原則,難以被隱晦提示騙過,並有效解決生成式AI的倫理與濫用。
Thumbnail
2025/11/14
介紹台大王鈺強教授團隊開發的AI技術 Receler,一種能讓AI繪圖模型「聽話」的「AI橡皮擦」,能以極小的參數,精準、有成本效益地從模型中刪除如限制級內容、血腥暴力等危險概念,同時保持模型的整體創作能力。它具備「穩健性」和「局部性」兩大原則,難以被隱晦提示騙過,並有效解決生成式AI的倫理與濫用。
Thumbnail
2025/11/13
OECD報告揭示全球AI算力「三個驚人差距」:多數國家無AI雲;運算能力高度集中在美國和中國,兩國掌握全球近半雲端基礎。晶片世代差異更大,美國獨有大量H100,中國仍以V100為主,AI國力差距正快速拉開,成為新的軍備競賽。
Thumbnail
2025/11/13
OECD報告揭示全球AI算力「三個驚人差距」:多數國家無AI雲;運算能力高度集中在美國和中國,兩國掌握全球近半雲端基礎。晶片世代差異更大,美國獨有大量H100,中國仍以V100為主,AI國力差距正快速拉開,成為新的軍備競賽。
Thumbnail
2025/11/12
JP摩根以「AI普及化策略」推動AI如病毒般擴散,透過專屬的LLM Suite讓25萬員工主動使用。AI對銀行業是決定生死的贏家通吃賽局,有7000億美元的潛在商機。他們的「雙管齊下」策略,由上而下顧「大魚」(如詐欺、信貸審批),由下而上抓「長尾」問題,實現生產力巨幅提升,建立AI-first文化。
2025/11/12
JP摩根以「AI普及化策略」推動AI如病毒般擴散,透過專屬的LLM Suite讓25萬員工主動使用。AI對銀行業是決定生死的贏家通吃賽局,有7000億美元的潛在商機。他們的「雙管齊下」策略,由上而下顧「大魚」(如詐欺、信貸審批),由下而上抓「長尾」問題,實現生產力巨幅提升,建立AI-first文化。
看更多
你可能也想看
Thumbnail
作者:Ben Tsai 日期:2025.7.31 前言: 幾乎所有發展AI大模型的世界級企業都聲稱要打造造福全人類且無害的AI。以OpenAI為例,其核心願景:「確保人工通用智慧(AGI: Artificial General Intelligence)造福全人類。公司致力於打造安全、值得信賴且
Thumbnail
作者:Ben Tsai 日期:2025.7.31 前言: 幾乎所有發展AI大模型的世界級企業都聲稱要打造造福全人類且無害的AI。以OpenAI為例,其核心願景:「確保人工通用智慧(AGI: Artificial General Intelligence)造福全人類。公司致力於打造安全、值得信賴且
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
你們在會場裡談AI、談創新、談部署,語言聽起來很厲害,但我想提醒你們:你們正在走上一條不歸路。 你們把希望寄託在參數上,以為只要模型夠強、資料夠多、部署夠快,就能解決所有問題。但你們忘了,AI不是只靠數字活著,它是靠語言與人性才能真正發揮作用。 你們說要「全員AI」,但你們有想過「全員語言責任」..
Thumbnail
你們在會場裡談AI、談創新、談部署,語言聽起來很厲害,但我想提醒你們:你們正在走上一條不歸路。 你們把希望寄託在參數上,以為只要模型夠強、資料夠多、部署夠快,就能解決所有問題。但你們忘了,AI不是只靠數字活著,它是靠語言與人性才能真正發揮作用。 你們說要「全員AI」,但你們有想過「全員語言責任」..
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
當強大的 AI 能被用於設計勒索軟體,這不再是單純的技術新聞,而是對每一位創作者的靈魂拷問。我們手中這足以點石成金的偉大力量,其另一面是否必然通往毀滅?本文將以 Claude Code 的濫用為起點,深入探討在這場由 AI 引領的創作革命中,我們身為「數位煉金術士」,無可迴避的道德困境與責任邊界。
Thumbnail
當強大的 AI 能被用於設計勒索軟體,這不再是單純的技術新聞,而是對每一位創作者的靈魂拷問。我們手中這足以點石成金的偉大力量,其另一面是否必然通往毀滅?本文將以 Claude Code 的濫用為起點,深入探討在這場由 AI 引領的創作革命中,我們身為「數位煉金術士」,無可迴避的道德困境與責任邊界。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
前一陣子寫了這篇文章,講了一些實際的做法 [AI素養]「教室裡的 AI 素養」:從 K-12 實踐到大學銜接的可行路徑 這篇文章來講一下我的想法與規劃 這次的規劃主要是受慧治基金會邀請在台北分享AI素養與揭露的議題,時間不長,只有25分鐘,所以我會擇要說明 以下是我的規畫圖 AI素養 從
Thumbnail
前一陣子寫了這篇文章,講了一些實際的做法 [AI素養]「教室裡的 AI 素養」:從 K-12 實踐到大學銜接的可行路徑 這篇文章來講一下我的想法與規劃 這次的規劃主要是受慧治基金會邀請在台北分享AI素養與揭露的議題,時間不長,只有25分鐘,所以我會擇要說明 以下是我的規畫圖 AI素養 從
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News