📝:演算法難以拼湊出「人味」的即興創造|卡內基美隆大學:AI 作曲傾向走安全、保守的路線

更新 發佈閱讀 6 分鐘
由 ChatGPT 生成

由 ChatGPT 生成



本文參考自卡內基美隆大學的校內報導《As AI-Generated Music Advances, Humans Still Lead in Creativity, CMU Research Finds》作者為 Stacey Federoff。


當我們在 2026 年回頭審視人工智慧對藝術領域的衝擊時,音樂無疑是最具爭議的領域之一。

從能夠生成電台品質音軌的 Udio 到登上告示牌(Billboard)榜單的 AI 虛擬歌手,AI 似乎已經無所不能。然而,卡內基美隆大學(CMU)的一項跨學科研究卻為這股熱潮澆了一盆冷水:

AI 雖然能「寫」歌,但在與人類的創意博弈中,依然存在難以跨越的鴻溝。

這項研究揭示了一個核心矛盾 — — 雖然 AI 大幅提升了「生產效率」,但在衡量藝術價值的「原創性」與「創造力」指標上,演算法的表現卻不盡如人意。


140 位音樂人的創意

為了釐清 AI 對創作過程的實質影響,卡內基美隆大學的海因茲學院(Heinz College)與音樂學院組成了一個跨學科團隊。研究主導者 Jose Oros 針對 140 位受過音樂訓練的參與者進行了一場對照實驗:

實驗設計:參與者被要求使用小型鋼琴鍵盤創作一段 15 秒的旋律。

對照變數: 一組參與者可以使用名為 Udio 的生成式 AI 平台,透過文字提示(Text Prompts)尋求靈感或生成旋律片段;另一組則完全不依賴 AI 進行獨立創作。

評審機制: 創作完成後,由另一組聽眾根據「創造力」、「享受程度」以及「音樂性」進行盲測評分。

AI 生成的音樂往往使用的音符較少,傾向於選擇「安全」且「標準化」的旋律走向。

人類創作的勝出

AI 傾向保守作曲

AI 生成的音樂往往使用的音符較少,傾向於選擇「安全」且「標準化」的旋律走向。本質上,AI 就是基於常態分佈的模型,生成最常見同時也是最平庸的曲風和作品。

AI 輔助反而更慢

令人驚訝的是,研究發現 AI 輔助組的創作速度反而較慢。

當 AI 產出海量內容時,人類創作者必須花費大量時間進行篩選、過濾與修飾(Curation)。這種「從大量平庸中尋找金子」的過程,往往比從零開始的靈感閃現更加耗費心智。

Jose Oros 指出,過去大部分關於 AI 的研究都聚焦於「生產力」(Productivity),但在藝術領域,我們更在乎的是「創造力」(Creativity)與「新穎性」(Novelty)。

如果工具無法幫助創作者突破既有框架,其社會價值就必須被重新審視。


人類經驗的不可替代

卡內基美隆大學音樂理論副教授 Richard Randall 提出了一個深刻的觀點:

「音樂是一個動詞,而不是一個放在桌上的名詞。」

這句話精確地捕捉到了人類音樂與演算法生成的本質差異:

音樂是「行為」:對人類而言,音樂是個人經驗、靈感與情感的表達。建立在創作者與聽眾之間的情感共鳴上。

AI 是「衍生」: 生成式 AI(如 LLM)本質上是透過龐大的數據語料庫進行學習。AI 所產出的內容是基於「機率」的組合,而非出於表達自我的慾望。

Randall 認為,人類在處理音高、節奏時,會加入非公式化的處理,例如細微的節奏延遲、推動或力度變化(Rhythmic pullbacks, delays and pushes)。這些「不完美」與「不可預測性」正是音樂打動人心的關鍵

相比之下,AI 的創作總是傾向於「打安全牌」(Playing it safe),其本質永遠是衍生性的(Derivative)

人類在處理音高、節奏時,會加入非公式化的處理。

從「競爭」到「協作」

卡內基美隆大學並非全面否定 AI,而是試圖開發更具「共生關係」的工具。

Amuse:圖像與文字的旋律轉譯

由電腦科學系助理教授 Chris Donahue 領導的「生成創意實驗室」(Generative Creativity Lab)開發了名為 Amuse 的工具。這是一個讓人類與 AI 深度協作的平台:

使用者可以上傳圖像、文字或音頻。AI 會將這些非音樂性的素材轉化為音樂和弦進程。但最終的驅動力依然是「人類的意圖」(Human Intentionality)。

PianoGenie:藝術家的靈感夥伴

Donahue 曾與 Google AI 及搖滾樂團 The Flaming Lips 合作開發 PianoGenie。這類工具的初衷並非取代作曲家,而是作為一個「創意思考的腳手架」(Creative ideation support),幫助藝術家在枯竭時找到意想不到的切入點。

Donahue 相信,雖然 AI 終有一天能生成與人類音樂同樣動人的聲波,但人類對於創作過程的介入和主觀意圖,將永遠是音樂體驗的核心。



AI 只能是催化劑

卡內基美隆大學的這份研究為我們勾勒出了 AI 在音樂領域的定位:

AI 可以是優秀的「靈感探索工具」(Ideation tool)
而不是一個成熟的「獨立藝術家」。

未來,AI 與人類音樂的關係或許會朝向以下三個方向發展:

  1. 降低參與門檻: 生成式 AI 讓音樂知識不足的人也能嘗試創作,這是一種「音樂創作的民主化」。
  2. 輔助創意發想: 對於專業人士,AI 可以提供不同維度的和弦或旋律建議,打破創作慣性。
  3. 重新定義「人的價值」: 當演算法能產出 80 分的平庸音樂時,人類那 20% 的非公式化、充滿經驗的情感表達(如節奏的微調、音色的塑造),將會變得更加珍貴且高價。

正如研究團隊所強調的,人類的創造力是沒有上限的

雖然演算法善於在已有的模式中進行排列組合,但只有人類具備打破規則、將個人生命經驗轉化為獨特旋律的能力。AI 或許可以模擬音樂的形式,但只有人類能賦予音樂靈魂。

留言
avatar-img
社會人的哲學沉思
191會員
345內容數
從物理到電機工程再轉到資訊傳播,最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、傳播理論、社會學、心理學、哲學游移;期盼有天無產階級可以推倒資本主義的高牆的兼職家教。
2026/03/10
在我看來,專業的記者與社會學家其實是一種近親。分屬新聞與學術的兩個世界:一個奔走於現場、一個沉思於書桌。但如果把「提問」視為職業的核心技藝,其實都靠著問問題謀生。
Thumbnail
2026/03/10
在我看來,專業的記者與社會學家其實是一種近親。分屬新聞與學術的兩個世界:一個奔走於現場、一個沉思於書桌。但如果把「提問」視為職業的核心技藝,其實都靠著問問題謀生。
Thumbnail
2026/03/03
照片是一種單次曝光的產物,呈現的是一個瞬間、一個切片、一個被壓縮、裁切的世界。與繪畫相比,照片缺乏時間的發酵與流動,而是用「驚鴻一瞥」的方式固定住當下。
Thumbnail
2026/03/03
照片是一種單次曝光的產物,呈現的是一個瞬間、一個切片、一個被壓縮、裁切的世界。與繪畫相比,照片缺乏時間的發酵與流動,而是用「驚鴻一瞥」的方式固定住當下。
Thumbnail
2026/02/24
2026/02/24
看更多
你可能也想看
Thumbnail
半年前,還有人與我激烈爭論:「寫作,應該親自去寫,還是可以藉由 AI 協助?」當時的語氣多半帶著憂慮、警惕,甚至是防備。有人說,若創作不再由人執筆,那麼靈魂將不復存在;也有人認為,這是一種對技藝的褻瀆,是對「創作者」身分的不尊重。 文字創作不說,談影片創作,以前要做影片需要許多時間,現在不用,只要
Thumbnail
半年前,還有人與我激烈爭論:「寫作,應該親自去寫,還是可以藉由 AI 協助?」當時的語氣多半帶著憂慮、警惕,甚至是防備。有人說,若創作不再由人執筆,那麼靈魂將不復存在;也有人認為,這是一種對技藝的褻瀆,是對「創作者」身分的不尊重。 文字創作不說,談影片創作,以前要做影片需要許多時間,現在不用,只要
Thumbnail
  就像有寫作能力的人即便在創作過程中使用了GPT,也不會直接把GPT生成出來的文章當作最終結果。繪圖AI在這些對於繪畫、對於藝術創作有更多想法與技藝的人眼裡與手中,不會是一種「AI繪圖」與「人類繪圖」的二元選擇。而是,雖然它要求了一種與過往截然不同的握持方式,但它還是一種「畫筆」。
Thumbnail
  就像有寫作能力的人即便在創作過程中使用了GPT,也不會直接把GPT生成出來的文章當作最終結果。繪圖AI在這些對於繪畫、對於藝術創作有更多想法與技藝的人眼裡與手中,不會是一種「AI繪圖」與「人類繪圖」的二元選擇。而是,雖然它要求了一種與過往截然不同的握持方式,但它還是一種「畫筆」。
Thumbnail
📸 照片上傳至 ChatGPT 真的安全嗎?美國史丹佛大學隱私專家發出警告 關鍵字: ChatGPT、隱私保護、數位安全、深偽技術、史丹佛大學 摘要: 隨著 ChatGPT 圖片上傳功能的普及,史丹佛大學隱私專家 Jennifer King 警告用戶上傳照片的潛在風險。用戶上傳照片後即失去對
Thumbnail
📸 照片上傳至 ChatGPT 真的安全嗎?美國史丹佛大學隱私專家發出警告 關鍵字: ChatGPT、隱私保護、數位安全、深偽技術、史丹佛大學 摘要: 隨著 ChatGPT 圖片上傳功能的普及,史丹佛大學隱私專家 Jennifer King 警告用戶上傳照片的潛在風險。用戶上傳照片後即失去對
Thumbnail
本文探討了AI指令與程式碼在語言、運作方式和著作權方面存在差異。AI指令的著作權議題取決於獨立性、原創性、展現形式和目的。AI產生的AI指令可能需要考慮人類參與程度、修改程度以及AI生成的獨立性。AI生成的內容,雖然缺乏創造力和情感,仍是重要的工具和手段,與人類合作能夠發揮最大的潛力。
Thumbnail
本文探討了AI指令與程式碼在語言、運作方式和著作權方面存在差異。AI指令的著作權議題取決於獨立性、原創性、展現形式和目的。AI產生的AI指令可能需要考慮人類參與程度、修改程度以及AI生成的獨立性。AI生成的內容,雖然缺乏創造力和情感,仍是重要的工具和手段,與人類合作能夠發揮最大的潛力。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
今日收錄 8 篇|涵蓋 AI・晶片・健康・機器人・創作・治理 01|😴 青少年愈睡愈少,專家:已成全美流行病 關鍵字: #青少年睡眠 #睡眠不足 #心理健康 #上課時間 #公共衛生 #美國教育 摘要: 根據《美國醫學會雜誌》最新報告,2023 年約四分之三的美國高中生每晚睡眠不足 8 小時
Thumbnail
今日收錄 8 篇|涵蓋 AI・晶片・健康・機器人・創作・治理 01|😴 青少年愈睡愈少,專家:已成全美流行病 關鍵字: #青少年睡眠 #睡眠不足 #心理健康 #上課時間 #公共衛生 #美國教育 摘要: 根據《美國醫學會雜誌》最新報告,2023 年約四分之三的美國高中生每晚睡眠不足 8 小時
Thumbnail
AI的錯誤,往往最能映照出人類的盲點。當我們說「人工智慧出錯」,其實是在說:它忠實地反映了我們給它的世界。那個世界充滿矛盾、偏見、模糊的界線與人類自身的慾望。最近有個例子讓人印象深刻——有人指令AI要畫出「一個男人溫柔地抱女人上床」的畫面。AI理解「抱」與「上床」,結果生成的圖卻帶有明顯情色姿勢
Thumbnail
AI的錯誤,往往最能映照出人類的盲點。當我們說「人工智慧出錯」,其實是在說:它忠實地反映了我們給它的世界。那個世界充滿矛盾、偏見、模糊的界線與人類自身的慾望。最近有個例子讓人印象深刻——有人指令AI要畫出「一個男人溫柔地抱女人上床」的畫面。AI理解「抱」與「上床」,結果生成的圖卻帶有明顯情色姿勢
Thumbnail
📰 今日科技新聞 1. 微軟裁減 9,000 名員工,重點投資人工智慧 微軟宣布將裁減多達9,000名員工,這是該公司今年最新一波的裁員行動,約占其全球228,000名員工的4%。此次裁員將影響多個部門,報導指出Xbox遊戲部門可能會受到影響。微軟計劃在人工智慧領域進行大規模投資,預計在20
Thumbnail
📰 今日科技新聞 1. 微軟裁減 9,000 名員工,重點投資人工智慧 微軟宣布將裁減多達9,000名員工,這是該公司今年最新一波的裁員行動,約占其全球228,000名員工的4%。此次裁員將影響多個部門,報導指出Xbox遊戲部門可能會受到影響。微軟計劃在人工智慧領域進行大規模投資,預計在20
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
半年前,還有人與我激烈爭論:「寫作,應該親自去寫,還是可以藉由 AI 協助?」當時的語氣多半帶著憂慮、警惕,甚至是防備。有人說,若創作不再由人執筆,那麼靈魂將不復存在;也有人認為,這是一種對技藝的褻瀆,是對「創作者」身分的不尊重。文字創作不說,談影片創作,以前要做影片需要許多時間、場景調度、外景
Thumbnail
半年前,還有人與我激烈爭論:「寫作,應該親自去寫,還是可以藉由 AI 協助?」當時的語氣多半帶著憂慮、警惕,甚至是防備。有人說,若創作不再由人執筆,那麼靈魂將不復存在;也有人認為,這是一種對技藝的褻瀆,是對「創作者」身分的不尊重。文字創作不說,談影片創作,以前要做影片需要許多時間、場景調度、外景
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News