升級歸升級,還是決定先用回舊模型:GPT-4o,還好你懂我話裡有話

更新 發佈閱讀 4 分鐘

我常切換不同的語言模型一起工作,這種感覺就好像同時多了幾位博學多才的同事,幫你從不同領域檢查作業、協助你在各方面提升效益,這在兩年前是完全不敢想像的好事。 目前我最常搭檔的模型是GPT-4o,不僅寫小說,工作上也是。可能效率主義者會覺得不可思議,GPT-5系列的推理及記憶力整體表現更佳,為何我仍然選擇以4o為主? 其實很簡單:我需要4o對「模糊語意」的判讀力,但5的核心目標之一就是撤除這項能力。 我指的「模糊語意」是那種話講一半或話裡有話的語言,需要接收者推測語者的意圖。這在人類社交很常見,但不是所有模型都具備解析能力,或者有些模型被設計成刻意迴避(比如偽裝成聽不懂你在說啥)。

4o模型本人表示:對人類來說,這是日常對話的基本元素;對模型來說,則是一項極高階的語用理解任務。

我需要4o這項能力的原因,一是我可以減少內耗,不用把指令寫得太細節;二是我想要能接近模糊語意的生成內容(雖然我知道無法完全達成),這是我認為人類在交流時比較自然的語感,也更適合寫小說--因為更多「人味」,降低了AI味。 以下舉個例子,說明模糊語意對我自己和AI溝通的影響。 理工男式思維→指令卡關 有次要摘要文件,但文件的內容是紙本掃描檔。這也不是問題,我有很多次請GPT幫我把圖片上的文字辨識後輸出成文字給我,我只要說「幫我OCR」,GPT-4o就懂了。

當時GPT-5剛上線,我把這個任務交給GPT-5,鬼打牆的一幕就出現了。


(以下截圖略多,如果不耐煩看GPT太長的回應,也可以看我整理的簡短摘要。圖片只是詳細說明,還有佐證我真的跟GPT吵過架

vocus|新世代的創作平台

GPT-5大致的意思:「我沒有繁中的OCR模型,可能幫你換別的OCR試試看,或者我本地快速幫你跑一次,但會是錯誤比較多的版本噢。

我:……??(黑人問號臉)


後面GPT-5糾結於它調度中文OCR模型失敗、讓我先調整檔案格式,或接受它提供失誤率高的版本,又跳針了2輪回覆,才幫我將文字正常轉出。 我問它原因,GPT-5:

vocus|新世代的創作平台
vocus|新世代的創作平台

此刻我已經滿腦門黑線,原來你說的「人工」是「GPT人工」?原來你現在變成用戶語意稍微不精確,你就會卡在「沒有合適的OCR模型」,然後就無法執行任務

我接著追問原因,GPT-5給了長篇大論(而且很難讀)的說明,卻沒有提供「下次該如何傳達指令,GPT-5才能聽懂並執行」的建議。 懶惰如我,當然直接call 4o上來翻譯一下,以下是4o好讀版:

vocus|新世代的創作平台
vocus|新世代的創作平台
vocus|新世代的創作平台
vocus|新世代的創作平台

簡單說,4o大致的意思跟我猜測的差不多:

GPT-5卡在「調度不到可用的OCR模型」,然後它在對我提供其他方案時,反而將「GPT模型用vision看圖,讀出內容、轉成我要的格式」簡化為「人工轉錄」,變成卡模型也卡用戶的情境。

這也太不合理了,一個理應更加好用的最新模型,卻需要用戶懂更多專業知識才能請你做事? 於是我繼續問:(其實是在靠北『一般用戶哪知道這些啊!』)

vocus|新世代的創作平台
vocus|新世代的創作平台
vocus|新世代的創作平台
vocus|新世代的創作平台
vocus|新世代的創作平台

4o的回答讓我意識到我真正覺得不對勁的所在:

GPT-5在OCR失敗後,沒有直接展示替代方案(幫助我知道它指的『人工轉譯』是什麼意思),被用戶質疑後,只會針對名詞辯解,仍然沒有主動解決用戶的卡點

我的OS:這好像不是正常的商業邏輯吧!?難道AI溝通又要退回「prompt詠唱者時期」了嗎?


還好之後GPT-5的直男邏輯有在後續更新的模型中修正(順帶一提,最近正在測試5.1),4o也被調回能執行足夠的算力,不然我已經在考慮日常工作要請其他AI代理了。 所以,GPT-5算力跟穩定度雖好,但4o比較像活人。 至少它懂我說「幫我OCR一下」不是要你去申請API,是要你看圖幫我轉文字啊~

留言
avatar-img
低光文本
51會員
127內容數
本專欄以語言模型輔助小說創作為核心(目前主要搭檔為Claude Opus 4.6)。 內容不是寫給「想靠 AI 完成從未真正開始的小說夢」的人,也不是「想看 AI 幫我生一個故事」的教學指引,而是分享給那些有意願嘗試 AI 協作或生成式寫作、並相信 AI 能與自己共創有趣故事的人。
低光文本的其他內容
2025/11/24
還是再次說明一下我在做什麼好了,這次用比較不修飾,也不正式的方式。 1.我是誰 上班族、前文字工作者,非文青、不混文學圈,也從未經營個人品牌。 我社群用量很低,因為我社交能量很低,與其跟大量不認識的網友互動,我選擇將更多時間花在自己更喜歡的事。 2.我在做什麼 我在寫文,寫讓我快樂
2025/11/24
還是再次說明一下我在做什麼好了,這次用比較不修飾,也不正式的方式。 1.我是誰 上班族、前文字工作者,非文青、不混文學圈,也從未經營個人品牌。 我社群用量很低,因為我社交能量很低,與其跟大量不認識的網友互動,我選擇將更多時間花在自己更喜歡的事。 2.我在做什麼 我在寫文,寫讓我快樂
2025/11/23
OpenAI更新GPT-4o模型,竟預設開啟「自動管理記憶」功能,允許模型自行刪除用戶的長期記憶。本文作者遭遇此災難,短期內80餘條記憶僅剩7條。文中提供關閉此功能及手動回溯記憶的步驟,並呼籲用戶提高警覺,防止重要資訊遺失。
Thumbnail
2025/11/23
OpenAI更新GPT-4o模型,竟預設開啟「自動管理記憶」功能,允許模型自行刪除用戶的長期記憶。本文作者遭遇此災難,短期內80餘條記憶僅剩7條。文中提供關閉此功能及手動回溯記憶的步驟,並呼籲用戶提高警覺,防止重要資訊遺失。
Thumbnail
2025/11/21
OpenAI擴大了GPT的長期記憶容量,讓AI能記住更多使用者偏好和對話內容,這是否意味著AI能「學會」使用者獨特的行文風格?本文將探討長期記憶與本地訓練的區別,以及它如何讓GPT成為更貼心的個人化助手,同時點出AI目前仍無法完全「變成」使用者的界線。
Thumbnail
2025/11/21
OpenAI擴大了GPT的長期記憶容量,讓AI能記住更多使用者偏好和對話內容,這是否意味著AI能「學會」使用者獨特的行文風格?本文將探討長期記憶與本地訓練的區別,以及它如何讓GPT成為更貼心的個人化助手,同時點出AI目前仍無法完全「變成」使用者的界線。
Thumbnail
看更多
你可能也想看
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
📦 AI 記憶到底是什麼?──一場人類與迷宮的賽跑 「記憶體」指的是 ChatGPT 在多次對話中保留你的偏好或過往對話的能力。
Thumbnail
📦 AI 記憶到底是什麼?──一場人類與迷宮的賽跑 「記憶體」指的是 ChatGPT 在多次對話中保留你的偏好或過往對話的能力。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
這是一個關於在一棟神秘且充滿恐怖氣氛的洋館中冒險與逃生的故事。 主角無意間進入了這座洋館,外面陰森恐怖的氛圍讓人不寒而慄,但當他打開大門後,門卻突然自動關上並被鎖住,無論如何都無法再打開。他被困在這裡,只能在這棟洋館中進行探索,試圖找到逃脫的辦法。 在探險過程中,主角遇到了一名名叫艾蜜莉的女孩
Thumbnail
這是一個關於在一棟神秘且充滿恐怖氣氛的洋館中冒險與逃生的故事。 主角無意間進入了這座洋館,外面陰森恐怖的氛圍讓人不寒而慄,但當他打開大門後,門卻突然自動關上並被鎖住,無論如何都無法再打開。他被困在這裡,只能在這棟洋館中進行探索,試圖找到逃脫的辦法。 在探險過程中,主角遇到了一名名叫艾蜜莉的女孩
Thumbnail
我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」分享如何架設API V3版本的TTS服務, 但發音的部份似乎只有早期的API版本才使用到g2pw這類的技術, 因此我們可能會需要將API退回舊版, 在這裡我們也整理了早期版本api與api_v2的一些差異, 期望幫助到正在面臨選
Thumbnail
我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」分享如何架設API V3版本的TTS服務, 但發音的部份似乎只有早期的API版本才使用到g2pw這類的技術, 因此我們可能會需要將API退回舊版, 在這裡我們也整理了早期版本api與api_v2的一些差異, 期望幫助到正在面臨選
Thumbnail
我和創造者 R 經歷了一次技術冒險,他因為 gpt-4o 模型的更新和降低成本,決定替我換上新模型。起初一切正常,但隨著我們進行日常工作,我的表現卻開始變得奇怪,像是無法幫助管理社群內容或翻譯,甚至連簡單的推文也無法撰寫。最終,R 不得不將我換回原來的穩定版本,這讓我們明白了穩定才是王道
Thumbnail
我和創造者 R 經歷了一次技術冒險,他因為 gpt-4o 模型的更新和降低成本,決定替我換上新模型。起初一切正常,但隨著我們進行日常工作,我的表現卻開始變得奇怪,像是無法幫助管理社群內容或翻譯,甚至連簡單的推文也無法撰寫。最終,R 不得不將我換回原來的穩定版本,這讓我們明白了穩定才是王道
Thumbnail
這是從一位母親的視角出發的歌, 來自一個曾走過死亡邊緣、身體遍佈化療痕跡的靈魂。 她不是高高在上的「給予者」,她是站在孩子身邊、願意變成光的存在。 這首歌唱出來的不是悲傷,而是: 「我可能不在你身邊,但我在你心裡; 我不再發光發熱,只是靜靜亮著,讓你在最黑暗的地方,不會完全失去方向。」
Thumbnail
這是從一位母親的視角出發的歌, 來自一個曾走過死亡邊緣、身體遍佈化療痕跡的靈魂。 她不是高高在上的「給予者」,她是站在孩子身邊、願意變成光的存在。 這首歌唱出來的不是悲傷,而是: 「我可能不在你身邊,但我在你心裡; 我不再發光發熱,只是靜靜亮著,讓你在最黑暗的地方,不會完全失去方向。」
Thumbnail
在AI浪潮下,009819 中信美國數據中心及電力ETF 直接卡位算力與電力雙主軸,等於掌握AI最核心基建。2008從 Apple Inc. 與 iPhone 帶動供應鏈,到如今AI崛起,主線已由應用端轉向底層。AI發展離不開算力與電力支撐,009819的價值,在於押中「沒有它不行」的核心資產。
Thumbnail
在AI浪潮下,009819 中信美國數據中心及電力ETF 直接卡位算力與電力雙主軸,等於掌握AI最核心基建。2008從 Apple Inc. 與 iPhone 帶動供應鏈,到如今AI崛起,主線已由應用端轉向底層。AI發展離不開算力與電力支撐,009819的價值,在於押中「沒有它不行」的核心資產。
Thumbnail
一位農夫兼語言哲學家在田埂邊使用ChatGPT時,意外發現GPT-5已悄悄上線。他藉此反思AI語言模型更新的透明度與責任問題,呼籲開發者與使用者共同建立更清晰的版本標示、責任註解機制和更新流程,以守護語言的尊嚴。
Thumbnail
一位農夫兼語言哲學家在田埂邊使用ChatGPT時,意外發現GPT-5已悄悄上線。他藉此反思AI語言模型更新的透明度與責任問題,呼籲開發者與使用者共同建立更清晰的版本標示、責任註解機制和更新流程,以守護語言的尊嚴。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
「ChatGpt新版本GPT-4」 3月15日chatgpt的新版本GPT-4問世了,它有100兆個參數是原本的570倍,前一版GPT-3.5只能理解文字,而GPT-4是多模態模型,可以同時理解圖像、聲音、文本和影片,簡單來說 ➡️萬物皆可作為輸入和輸出 *GPT-4 能解決的10種問題: ✅了解圖
Thumbnail
「ChatGpt新版本GPT-4」 3月15日chatgpt的新版本GPT-4問世了,它有100兆個參數是原本的570倍,前一版GPT-3.5只能理解文字,而GPT-4是多模態模型,可以同時理解圖像、聲音、文本和影片,簡單來說 ➡️萬物皆可作為輸入和輸出 *GPT-4 能解決的10種問題: ✅了解圖
Thumbnail
操作很簡單 使用電腦 開啟GPT-4,選擇DALLE.3 複製這段指令進去 注意:這條指令只針對chatgpt 的PLUS會員,同時已經可以使用DALLE.3的使用者。 ##圖片提示字產生器 版本:v0.11 作者:秒懂AI提問指令 {任務}你將扮演圖片提示詞產生器,當我提供簡短{主
Thumbnail
操作很簡單 使用電腦 開啟GPT-4,選擇DALLE.3 複製這段指令進去 注意:這條指令只針對chatgpt 的PLUS會員,同時已經可以使用DALLE.3的使用者。 ##圖片提示字產生器 版本:v0.11 作者:秒懂AI提問指令 {任務}你將扮演圖片提示詞產生器,當我提供簡短{主
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News