"1981年底某一天,崔博爾靈光一閃。麥金塔的記憶體不足以同時開兩個程式,因此無法像在麗莎那樣,在一個程式裡做好圖表,再切換到文字處理程式裡貼上。然而,能不能設計一些功能單一但實用的迷你應用程式(他稱之為「桌面裝飾」〔deskomament 〕),小到可以和大型程式同時執行? 何茲菲德於是設計出「時鐘」(Clock)、「計算機」(Caloulator),還有「剪貼簿」(Scrapbook,一個儲存應用程式,能讓你儲存所複製的文字片段或圖像)。程式設計師唐恩•丹曼 (Donn Denman)則貢獻「記事本」(Notepad)與「鬧鐘」(Alarm Clock)。凱柏斯寫了「鍵盤配置」(Key Caps),能夠顯示各個按鍵能輸出哪些符號:要輸入其他語言重音符號的時候,這項功能實在不可或缺。舉例來說,如果在按下E鍵的同時按住 Option鍵,就能得到像是「resume」裡面的「e」。凱柏斯在取「Key Caps」這個名稱的時候,真的沒有偷渡自己的姓「Capps」。「我是說,要是我真想偷渡自己的名字,至少會放兩個p吧,」他說。 最後還有「控制台」(Control Panel):一個完全以視覺操作為主的應用程式,也就是今天的「設定」或「偏好設定」。 1982年秋天,蘋果出版團隊覺得「裝飾」實在聽起來太過輕浮虛華,於是提議將這些實用的小程式改名為「桌面配件」(desk accessories)。接下來十七年間,桌面配件一直都是麥金塔的核心功能。"-蘋果之道:重新定義世界的50年 P205~206
一、1981年的靈光:記憶體不足的創意解法1981年底的某一天,蘋果麥金塔(Macintosh)開發團隊成員崔博爾(Tribble)面對一個棘手難題:Mac的記憶體根本不夠同時執行兩個完整程式。這意味著使用者無法像在麗莎(Lisa)電腦上那樣,在一個應用程式裡完成圖表,再切換到文字處理程式貼上。面對這道硬體高牆,崔博爾沒有選擇硬撞,而是靈機一動—能不能設計出功能單一、小巧精準的「迷你程式」,輕量到可以和大型程式共存於有限的記憶體之中?
這個想法催生了一系列「桌面配件」(Desk Accessories):何茲菲德(Hertzfeld)設計了時鐘、計算機與剪貼簿;丹曼(Donn Denman)貢獻了記事本與鬧鐘;凱柏斯(Capps)寫了鍵盤配置(Key Caps);另有控制台—今日設定介面的前身。這些工具不求龐大,只求精準,每一個都只做好一件事,卻都能與更大的程式和平共存。1982年秋天,「桌面配件」這個名稱正式定案,並成為麥金塔的核心功能長達十七年。
沒有人料到,這個在記憶體危機下誕生的設計哲學,會在四十年後的人工智慧時代,以驚人相似的面貌再度出現。
二、AI 時代的記憶體困境
大型語言模型(LLM)如 GPT-4、Gemini Ultra、LLaMA 3 等,動輒擁有數千億個參數,需要數十甚至數百GB的高速顯示記憶體(VRAM)才能運行。對於龐大的雲端資料中心而言,這或許不成問題;但對於一支 iPhone、一台筆記型電腦、一個邊緣運算裝置而言,卻是幾乎無法逾越的硬體高牆—與1981年麥金塔的困境在本質上驚人地相似。
更深的問題在於,AI 推理(inference)的工作負載本質是「記憶體頻寬受限」(memory-bandwidth bound),而非運算受限。這意味著即使堆疊更多 GPU 核心,若記憶體頻寬不足,效能仍會卡死。資料顯示,AI 推理市場在2024年已達970億美元規模,預計2030年將成長至2,537億美元。龐大的商業需求,迫使科技產業必須正視這個瓶頸,找出系統性解法。
三、「桌面配件哲學」的現代翻版
Apple Intelligence:最直接的精神繼承者
蘋果的解法,幾乎是崔博爾當年想法的直接翻譯。Apple Intelligence 並非一個龐大的單一模型,而是由多個高度專門化的生成模型組成的系統,每個模型只負責特定任務—文字摘要、智慧回覆、通知整理、圖像生成—並能即時切換、適應當前活動。
在技術層面,蘋果採用了低秩適應技術(LoRA),建立輕量的「適配器」(adapters),這些適配器依需求動態載入,針對特定任務微調模型,卻不改變基礎模型本身—正如當年各個桌面配件各司其職、不影響彼此。核心的約30億參數裝置端模型,透過 KV-cache 共享技術減少37.5%記憶體用量,並以2-bit量化壓縮,使整個系統能在iPhone的有限記憶體上流暢運行。
Microsoft Phi:「小而強大」的哲學宣言
微軟的 Phi 系列,直接挑戰了 AI 產業「越大越好」的迷思。Phi-4 以140億參數的架構,在數學推理上超越了數倍大的 Google Gemini Pro;而 Phi Silica 更是以33億參數、僅1.5瓦的超低功耗,內建於 Windows 作業系統的神經處理器(NPU)中,實現近乎即時的回應。這不正是現代版的「桌面配件」—輕巧、專精、隨時待命,內建於作業系統之中?
混合專家模型(MoE):多個「專家」同時待機
或許最能體現「桌面配件哲學」的,是當前 AI 架構的重大創新—混合專家模型(Mixture of Experts,MoE)。這種架構包含多個專門化的子模型,以及一個將每個輸入分配給少數「專家」的路由網路;在推理時,只有一小部分參數被啟動,大幅降低記憶體消耗。
DeepSeek-V3擁有6,710億總參數,但每次推理只啟動370億;Qwen3共2,350億參數,活躍的僅220億。這與麥金塔的「桌面配件」邏輯如出一轍:不是同時開啟所有功能,而是按需啟用最相關的小程式,讓系統在有限資源中維持高效運作。
四、跨越四十年的對照
兩個時代的困境與解法,幾乎是同一個故事的不同版本:
面向 | 1981年麥金塔時代 | 2024~2025年 AI 時代 |
核心困境 | 記憶體不足,無法同時執行兩個大程式 | VRAM不足,大型LLM無法在裝置端運行 |
設計哲學 | 功能單一的迷你程式(桌面配件) | 小型語言模型(SLM)/ LoRA 適配器 |
共存策略 | 與大型程式共存於有限記憶體 | 與作業系統共存於行動裝置 |
分工模式 | 時鐘、計算機、記事本各司其職 | 摘要、翻譯、程式輔助模型分工 |
代表成果 | 桌面配件沿用十七年 | SLM 生態系快速成熟標準化 |
五、侷限與差異:類比的邊界
這個跨世代的類比當然並非完美。1981年的桌面配件是靜態的、功能固定的程式;現代 AI 透過 LoRA 等技術,允許同一個基礎模型動態切換「人格」與「專長」,彈性遠超當年。更根本的差異在於,AI 推理的瓶頸是記憶體頻寬而非運算能力,這使得硬體層面的創新—如高頻寬記憶體(HBM)、專用神經處理器(NPU)—成為現代解法不可或缺的一環,這是純靠軟體設計的桌面配件時代所沒有的維度。
此外,現代 AI 的複雜度遠超當年:MoE 架構的路由與負載均衡、量化技術對精度的取捨、雲端與裝置端的混合部署,都是當年的麥金塔工程師無需面對的挑戰。然而,核心的設計直覺是一致的:
在資源受限的環境下,「功能單一、輕巧精準、按需啟用」的設計哲學,永遠比「塞入一個無所不能的龐然大物」更務實、更持久。
六、限制是創新之母
崔博爾在1981年的那道靈光,照亮的不只是麥金塔。它揭示了一個在資訊科技史上反覆驗證的真理:最深刻的創新,往往不是來自資源無限的豪奢揮霍,而是來自對約束條件的優雅回應。今日,當 Apple Intelligence 在 iPhone 的晶片上以微瓦功耗完成 AI 推理,當 Phi Silica 以不到2瓦的電力成為筆電的即時助理,當 MoE 模型以「按需啟用專家」的方式解決萬億參數的記憶體困境—我們看到的,正是那個設計哲學的當代回聲。
歷史不會重複,但它會押韻。從「桌面配件」到「小型語言模型」,押的是同一個韻腳:在限制中找到空間,在輕盈中凝聚力量。
























