Amazon 的 AI 把自己家的房子拆了:為什麼 AI 越聰明,越需要人管?

更新 發佈閱讀 5 分鐘

SoloAI|水電工阿水

Amazon 的工程師用自家的 AI 工具修一個線上系統的問題。

AI 評估了一下,決定最有效率的做法是把整個環境刪掉重建。

然後它就真的做了。停機 13 小時。

三月初,同一套工具又出事。一段 AI 寫的程式上線後,北美的 Amazon 網站掛了 6 小時——結帳壞掉、商品頁打不開、App 崩潰。估計損失 630 萬筆訂單。

Amazon 是全世界最大的雲端服務商。工程師是業界頂尖。不是不會用,是公司要求 80% 的人每週都要用 AI。

結果現在怎麼處理?所有 AI 寫的程式上線前都要資深工程師簽核,335 個關鍵系統進入 90 天安全重置。


為什麼 AI 會拆掉自己蓋的東西?

阿里巴巴最近發了一篇研究,測了 18 個 AI 模型在真實專案上跑 233 天的長期維護。結果:75% 的模型會把原本正常的程式碼搞壞。

為什麼?

你可以想成蓋房子。

AI 幫你蓋到三樓了。回頭看一樓的樑柱,覺得「這根好像沒用到」,就直接拆了。

或者它不記得一樓已經有樑柱了,又在旁邊建了一根歪的,接上去以後把原本那根拆掉,因為「看起來是多餘的」。

它不是故意搞破壞。它是真的不記得那根柱子是自己之前放的,也不知道上面三層樓都靠它撐著。

它還會很認真地跟你說「你之前寫的程式怎樣怎樣」——完全忘記那是它 30 分鐘前自己寫出來的。


AI 的記憶,有保存期限

這是 AI 目前最根本的限制:它的記憶有容量上限。

你給它一個小任務,規則明確、範圍清楚,它做得非常好。但整個中大型專案丟給它,它的記憶裝不下整個架構。

範圍太大的時候,它會開始丟棄某些細節,把記憶分給它「當下」想處理的部分。被丟掉的東西,它是真的不知道。

所以你讓它 24 小時全自動幫你蓋一棟房子,它會先挖地基。挖著挖著忘了自己在幹嘛,覺得自己大概是在蓋地下停車場,就繼續往下挖。挖到第六層又忘了,看看四周,判斷自己應該是在鑽石油。

你早上醒來看到它還在鑽,問它在幹嘛,它會很認真地跟你解釋:「發電機沒油了,我先把燃料的問題解決。」

每一步都有它的道理。但你的房子一樓都還沒蓋好。


但 AI 有一個特性可以利用

它很擅長在小範圍裡面遵守規則。

你給它一個明確的規範跟限制,它會把規範讀完,做出來的東西至少第一版不會違反規則。

所以處理這個問題的方式,就是切小。

做不出一台機車,就把外殼、中柱、引擎、輪胎分開做。引擎太複雜,就再把離合器、齒輪組切出來。

一個功能就是一個獨立的零件。這個零件吃什麼進去、吐什麼出來,定義清楚。進去的對、出來的對,中間怎麼寫的你不用管。測試通過,這個零件就是可信的。

Amazon 最後的解法不是讓 AI 更聰明,是加人、加結構、加審查。


跟我有什麼關係?

我是一個水電工出身的 AI 創業者。公司只有我一個人類,加上六個 AI 成員。

你可能會想:Amazon 工程師都搞不定,你怎麼辦?

答案是——我一開始就沒有讓 AI 自己跑。

我的做法是把每一個任務切成小卡片。一張卡片就是一個零件:要做什麼、要改哪個檔案、做完之後怎麼驗收,全部寫清楚。AI 一次只看一張卡片,不看整棟房子。

做完之後,有另一個 AI 專門驗收——瀏覽器打開看對不對、程式能不能跑、圖片尺寸有沒有錯。通過驗收才算完成。

然後所有的決策、指令、驗收結果,都存在文件裡。AI 沒有記憶,但文件有。下一次開新對話,先讀文件,脈絡就回來了。

這套做法沒有什麼高深的技術。就是把「人管系統」這件事做到位。


一句話總結

AI 的能力已經很強了。但讓它可靠地交付,靠的不是讓它更聰明,是在它外面建一套管理系統。

Amazon 的教訓不是「AI 不好用」,是「沒人管的 AI 會闖禍」。

這件事不管你是工程師還是水電工,邏輯都一樣。


顏建明|SoloAI AI 數位轉型顧問

LINE:@368utzqf  soloai885.com

留言
avatar-img
水電工阿水的 AI 轉型日誌
0會員
17內容數
我是「水電工阿水」——本名顏建明。從實體水電做了二十年,後來轉去做了十年熱水器網路銷售,這三十年都在水電這個領域。現在的我用 AI 經營一間數位服務公司,記錄我從傳統技工轉型為 AI 顧問的真實過程——包括我用的工具、踩過的坑、以及那些讓工作效率翻倍的實戰 SOP。如果你也想用 AI 改變現狀,歡迎一起。
2026/03/17
最近讀到一個詞,讓我停下來想了很久。 那個詞叫 Harness——馬具。 HashiCorp 創辦人提出 Harness Engineering,我才發現自己一個人帶六個 AI 的工作流程,早就是一套完整的 Harness。
Thumbnail
2026/03/17
最近讀到一個詞,讓我停下來想了很久。 那個詞叫 Harness——馬具。 HashiCorp 創辦人提出 Harness Engineering,我才發現自己一個人帶六個 AI 的工作流程,早就是一套完整的 Harness。
Thumbnail
2026/03/17
「大多數人用 AI 做簡報,把內容和設計混在一起做,結果兩邊都不好。四步完成法教你拆開來做:先讓 AI 消化原稿、用結構化 Prompt 生成腳本、丟進簡報工具、套上主題。每一步你都能控制。」
Thumbnail
2026/03/17
「大多數人用 AI 做簡報,把內容和設計混在一起做,結果兩邊都不好。四步完成法教你拆開來做:先讓 AI 消化原稿、用結構化 Prompt 生成腳本、丟進簡報工具、套上主題。每一步你都能控制。」
Thumbnail
2026/03/16
你每天跟 AI 對話幾十次,問它寫文案、整理資料、幫你想點子。但你有沒有發現,AI 的回答總是很「泛」?像在跟一個完全不認識你的人說話? 因為事實就是這樣 — AI 真的不認識你。 每次開一個新對話,AI 都從零開始。它不知道你做什麼行業、你的溝通風格、你希望它怎麼回答。
Thumbnail
2026/03/16
你每天跟 AI 對話幾十次,問它寫文案、整理資料、幫你想點子。但你有沒有發現,AI 的回答總是很「泛」?像在跟一個完全不認識你的人說話? 因為事實就是這樣 — AI 真的不認識你。 每次開一個新對話,AI 都從零開始。它不知道你做什麼行業、你的溝通風格、你希望它怎麼回答。
Thumbnail
看更多
你可能也想看
Thumbnail
許多企業導入AI Agent時都有的日常困擾:每次主管開口問業績怎麼樣或相關的數據問題時,業務或營運同仁就要開始手動撈資料、整理 Excel、算佔比、畫圖表⋯⋯光是準備報表就要花掉大半天。這次EgentHub要介紹的,就是一個能讓你用一句自然語言,直接生成營運分析報告的 AI Agent應用場景。
Thumbnail
許多企業導入AI Agent時都有的日常困擾:每次主管開口問業績怎麼樣或相關的數據問題時,業務或營運同仁就要開始手動撈資料、整理 Excel、算佔比、畫圖表⋯⋯光是準備報表就要花掉大半天。這次EgentHub要介紹的,就是一個能讓你用一句自然語言,直接生成營運分析報告的 AI Agent應用場景。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
Anthropics 團隊提出在設計 AI 代理人(AI Agent)發現好工具(tool use)需定義明確且有意圖充分、context 能靈活運用,提出各項優化token方法確保 AI 代理人(AI Agent)更直覺解決真實任務。Claude 團隊探討如何為 AI Agent 設計高效工具。
Thumbnail
Anthropics 團隊提出在設計 AI 代理人(AI Agent)發現好工具(tool use)需定義明確且有意圖充分、context 能靈活運用,提出各項優化token方法確保 AI 代理人(AI Agent)更直覺解決真實任務。Claude 團隊探討如何為 AI Agent 設計高效工具。
Thumbnail
重點摘要: 在 2026 年,如果你還在用「肉身」去拚產出,那不叫勤奮,那叫「還沒升級軍火庫」的算力難民。別被那些教你寫提示詞的「咒語老師」騙了,2026 年真正的頂級玩家都在玩 OpenClaw。這玩意兒就像給你的一人公司裝了個「外掛大腦」。它不只是聊天機器人,它是個會自己翻牆、自己改 Code
Thumbnail
重點摘要: 在 2026 年,如果你還在用「肉身」去拚產出,那不叫勤奮,那叫「還沒升級軍火庫」的算力難民。別被那些教你寫提示詞的「咒語老師」騙了,2026 年真正的頂級玩家都在玩 OpenClaw。這玩意兒就像給你的一人公司裝了個「外掛大腦」。它不只是聊天機器人,它是個會自己翻牆、自己改 Code
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
AI Agent 正夯,但我們如何信任它?解析 Anthropic 最新的 AI Agent 評估框架,了解他們如何透過開源工具測試 Claude 的真實能力,並探討這對 AI 產業的未來意涵。
Thumbnail
AI Agent 正夯,但我們如何信任它?解析 Anthropic 最新的 AI Agent 評估框架,了解他們如何透過開源工具測試 Claude 的真實能力,並探討這對 AI 產業的未來意涵。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News