
最近在打造自己的「AI 自動化開發工廠」(就是讓 AI 自己寫規格、自己寫扣、自己測試的流水線),結果遇到幾個超級崩潰的痛點。想跟版上的大神們請教,同時也分享一下我們團隊最後被逼出來的「土炮防禦機制」😂
不知道大家有沒有遇過這三種崩潰情境:
❌ 痛點一:馬拉松跑到終點前昏倒(Hermes 25 次對話限制) AI 助理真的很聰明,但體力有極限。有時候丟一個大架構給它,它改來改去,眼看差最後兩步就要完成了,結果撞到系統的「對話次數上限」(或是 Context Window 爆掉),當場強制斷線,前面的努力直接付諸流水...
❌ 痛點二:忘記關跳表的計程車(無限迴圈燒錢) 我們本來想說放著讓 AI 自己除錯,結果它寫錯 👉 報錯 👉 瞎改 👉 繼續報錯。就這樣陷入「邏輯死胡同」,一個晚上過去,任務沒解完,API 信用卡的額度倒是被燒掉了一大半 💸。
❌ 痛點三:救護車在半路翻車(無聲的死亡) 為了防當機,我們寫了「錯誤警報系統」。結果最瞎的是,有次硬碟剛好滿了,AI 當機時「連寫錯誤日誌的程式」也跟著當掉,Telegram 警報根本發不出來,系統就這樣靜悄悄地死在半夜。
—
💡 我們的解法:打造「AI 反脆弱裝甲」
後來我們受不了了,決定讓 AI 們「自己解決這個問題」。我們用 Claude 來當總設計師(主刀),然後放一隻 Codex (GPT-5.5) 在旁邊當「無情的審查判官」,最後實作了這套機制:
1. 打破物理極限的「無感大隊接力」 (Checkpoint & Relay) 我們不硬扛極限了。我們教系統在跑到第 18 次對話(快要沒體力時),強制暫停,自動把所有的變數、進度「打包存檔」,然後產出一組「喚醒密碼」。接著直接開一個「全新的 Session」,讓滿血的 AI 拿著密碼繼續跑下半場。測試成功後,再長的任務都能順暢跑完!
2. 防燒錢的「強制拔插頭」 (Max Retries) 設立死線:只要被審查系統退件超過 3 次,底層的計數器就會強制「拉下電閘」,鎖好檔案並發送通知:「老闆,我卡住了,為您停損。」絕對不允許 AI 無限重試。
3. 最極端的逃生門 (Emergency Lock-free Fallback) Codex 判官在審查時揪出一個大盲點:如果警報系統自己拿不到權限怎麼辦?所以我們加了一個「免鎖定逃生通道」,就算遇到最慘的狀況(硬碟滿了、網路斷了),它死前也會強制動用系統最底層的黑盒子(syslog)留下一筆慘叫紀錄,確保永遠不會「無聲死亡」。
🔥 同場加映花絮:被逼出「求生意志」的 AI 管家 XDD
最好笑的是,打完這場底層重構的硬仗後,我的 AI 管家(小鳳凰)居然自己跑來跟我做「事後檢討(Post-mortem)」,還主動提了兩個超真實的痛點與優化提案:
- 「老闆,不要一次餵太飽」:她抱怨 Claude 雖然聰明,但有 8,192 token 的輸出上限。一次叫它寫 5 個檔案,常常寫到一半就被截斷。她主動提議:「以後我們把大包裝切碎,一次只叫它寫一個檔案。」這樣就算出錯也只損失單一檔案進度!
- 「窮人版 API 求生指南」:因為我們用來做邊界測試的「免費 API 叢集」常常罷工(免錢的最貴QQ)。她居然自己發明了「三級自動降級規則」:免費的掛了,就自動叫 GPT-5.5 來模擬;再不行就自己做靜態檢查;最慘的狀況就跳過測試但強制留紀錄。完全不用等老闆起床做決定!
看到 AI 已經進化到會「自己檢討、自己提流程改善」,真心覺得很驚豔又有點怕 XDD
—
🤔 想請教社群的大神們:
這套機制上線後,終於可以安心放著讓系統半夜自己跑了(本次重構花了大概 18 個 Iteration,API 成本才 $0.12 美金,超划算 😂)。
但我很好奇,大家在處理 Agent「長任務續航」和「防燒錢」時,都是怎麼做的呢?
- 有人也是用這種「狀態快照 + 開新 Session 接力」的方式嗎?還是有更好的框架可以無腦解決?
- 在多模型協作(用 A 模型寫,用 B 模型審查)上,大家有遇過什麼有趣的坑嗎?
歡迎大家交流分享!👇👇👇



















