
Credit: Claude
從一幅畫開始
在我和Claude聊出〈Claude Moment〉那篇文章並做了封面後,突然冒出一個念頭:
Claude能做音樂嗎?不是找音樂、不是推薦歌單——是真的做出一段音樂。
我問了。它說可以試試。
原來Claude也能做音樂
我的要求很直覺:符合這幅畫的氣質。冷冽,有一點距離感,禁慾。
Claude用的是Web Audio API——不是去找現成的音樂,而是從數學波形開始,用程式碼生成聲音。第一版出來是環境音樂風格,長音為主,有低音脈動,偶爾一點高頻光點。
我聽了覺得——還不錯,但想要更有時代感。莫內是1872年的人,我希望有那個年代的味道。
「能做出印象派時期的音樂感嗎?」
它說可以,換成鋼琴,降D大調,帶華爾滋節拍。
我們來回試了很多版本
72 BPM太慢,像冥想音樂。94 BPM加了電子音,我說帥哥開口聲音不對。140 BPM純鋼琴,有點像小孩在練琴。
然後我說想要薩克斯風。
Claude重寫了音色合成的邏輯——用泛音疊加模擬吹奏感,加入氣息雜訊,試圖做出那種行雲流水的演奏者質感。
出來之後,還是很頓。音符之間像在數拍子,沒有那種一口氣吹出去的流暢。
我繼續要求。它繼續改——加入portamento滑音、人性化時間擾動、連續相位渲染。
每一版都比上一版好一點點,但始終跨不過那道坎。
老實說──
「老實說——用純數學合成薩克斯風到『專業演奏者』這個等級,是我目前做不到的。」
Claude解釋:真正的流暢感來自真實錄音的樣本、物理建模合成器、或AI音樂生成模型。這些在它的環境裡都沒有。它能做的是波形疊加,而這個方法已經到了天花板。
然後它給了我幾個替代方案:Suno、Udio、GarageBand。
我有點沮喪。但就在那個沮喪的瞬間,我想到了一件事。
BASIC
我第一次接觸電腦的年代,用BASIC語言寫程式,也用BASIC做過音樂。
那個聲音——單薄,電子感,每個音符都像一顆顆獨立的點——就是Claude今天做出來的聲音。
不是缺陷。是那個年代的美學語言。
機器試圖用它僅有的語言說話,那種笨拙裡面有一種純粹,反而讓人有感。Chiptune、8-bit音樂,現在還有人專門追求那個質地,因為它誠實。
我換了方向,要Claude做弦樂pad。出來之後,更像霧,但也更「素」——現代耳朵聽了會頓一下,覺得哪裡不對。
最後我們回到了鋼琴版。140 BPM,純鋼琴,沒有借用任何人的聲音,從數學波形開始造出來的。
樸實,但是它自己的。
節省了時間,拓展了表達
這整個過程裡,有一件事讓我印象很深。
Claude在生成音樂的時候,我去做了生活裡的其他事。回來,音樂好了,影片也好了。
我沒有學過任何樂器,也沒有學過影片剪輯。但今天,我有了一支配樂短片。
不完美,但是我想表達的東西在裡面。
創作的門檻降低了,不是因為AI替你想,而是因為AI替你執行了那些你不會的部分——讓你可以把精力放在你真正想說的事上。
這大概就是AI協作最真實的樣子:不是取代,是把你表達生命的機會,拓展了一點。
Claude為什麼做不到Gemini能做的事?
技術上,Claude在這個環境裡無法連網下載音樂樣本庫。這是實務限制。
但更深的是另一件事。
使用真實錄音樣本,牽涉到版權和授權。Anthropic在這方面的態度是謹慎的——不是沒有能力,是選擇在某個邊界內做事。就像Claude在很多地方的設計哲學:不是不能,是選擇不。
這讓我想到一個比較:
- Gemini收集樣本、合成模型、輸出接近真實的聲音——能力很強,結果很好聽。
- Claude從波形開始,用數學造聲音,做出來的像BASIC年代的練習曲——有限制,但每個音符都是第一性原理的產物。
















