📝📝:新媒體理論家 Lev Manovich: 生成式 AI 擅長「視覺上的超現實」,但抗拒「邏輯上的超現實」

更新 發佈閱讀 11 分鐘
Lev Manovich. via manovich.net

Lev Manovich. via manovich.net

本文參考自 Lev Manovich 著作《A Medium That Thinks》




我們正活在一個奇特的時代。

每天,有數以千萬計的人正在用AI工具創作圖像、音樂、影片、文字。這場創作革命來得如此迅速,以至於我們幾乎忘了停下來問一個根本問題:這個叫做「生成式AI」的東西,究竟是一種什麼樣的媒介?

媒體理論家兼藝術家 Lev Manovich 在他的最新論文《A Medium That Thinks》中,試圖跳脫那些關於 AI 的道德辯論與社會批評,從媒介本質的角度出發,分析了生成式AI 作為創作工具的六個核心特性。


1️⃣幾乎無法精準控制

AI 讓創作變得非常簡單,同時也讓「精準控制」變得極為困難。

對 Manovich 來說,這就是這個媒介(生成式 AI)的本質,而非科技的瑕疵或使用者技術不夠純熟。生成式 AI 的運作方式是從海量資料中提取模式,再透過機率預測來生成新內容。這就代表,AI 每次的輸出都含有不可消除的隨機性

對一般使用者來說,這種「失控感」或許無所謂,甚至充滿樂趣。但對於需要精確控制每一個視覺元素的設計師、廣告攝影師、品牌設計師而言,這個「樂趣」就成了職業道路上的一大阻力。

想像你要為一個商品設計廣告圖,商標的位置、文字的排版、光線的角度 — — 每一個細節都攸關品牌形象,但 AI 卻自顧自地做了無數個你無法預測的決定

Manovich 提出了一個有趣的分類方式:

我們可以把整個創作宇宙分成兩類:那些需要高度精準控制的創作,以及那些允許模糊與隨機的創作

前者包含大多數的商業設計工作,長度、厚度、高度、色澤、色溫、飽和度,背後都包藏著一組特定數值,而後者則可能更適合探索性的藝術實驗,隨機拼出的圖像即便不完美也能是一幅作品。

生成式 AI,天生就更適合後者。

大多數的商業設計工作,長度、厚度、高度、色澤、色溫、飽和度,背後都包藏著一組特定數值。

2️⃣史無前例的自由

在 AI 出現之前,藝術家已經用各種方式把「隨機性」引入創作過程。

這種對「不確定性」的追求在 1960 年代的紐約 Judson Dance Theatre 實驗表演中可見一斑,例如 Yvonne Rainer 或 Trisha Brown 的表演,在固定結構中保留即興空間 。爵士樂、哈普寧藝術(happenings)以及 John Cage 在現代音樂中使用的隨機(4 分 33 秒),都是創作自由度特性的歷史先聲 。

但這些方法有個共同限制:創作的「自由度」終究是有限的。傳統藝術家為了引入隨機性,常使用特定工具或方法,但這些系統通常只在極少數維度上運作 。

例如「分子系統」(particle system)雖然能控制分子的透明度、速度等參數,但其生成的視覺效果通常具有明顯的「家族相似性」,只要看多了就能瞥見其中不斷重複的技法與筆觸,其自由度是有限且可預期的 。

直到 AI 打破了這個限制。AI 能生成的內容涵蓋了創作宇宙中極為廣闊的可能性空間 — — 廣闊到讓人難以事先預想。這種「多維度的不可預測性」在人類創作史上是真正前所未有的。

這不只是數量上的差異,而是品質的躍遷。當你輸入一個提示詞,你真的不知道 AI 會把你帶到哪裡。這種驚喜感,既是魅力所在,也是挑戰所在。



3️⃣反前衛的本質

Manovich 認為這裡出現了一個有趣的矛盾。

AI 看起來能做任何事 — — 生成超現實的圖像、混搭不同風格、創造奇異的組合。似乎擁有無限的想像力。但 Manovich 指出,AI 骨子裡其實是保守的

AI 是透過學習「世界通常是什麼樣子」來運作的。從無數的網頁、圖片、文字中學到了我們日常生活的邏輯:事物的外觀、行為的規律、視覺的慣例。這讓 AI 非常擅長生成「正常」的內容。

你想讓 AI 生成一隻貓追著狗跑?

通常 AI 會抗拒,因為這違反了資料庫學到的「動物行為邏輯」。但如果你要求「沙漠中的融化時鐘」,AI 卻能輕鬆做到,因為時鐘和沙漠都是熟悉的元素,只是空間組合不尋常。甚至,西班牙超現實主義達利(Salvador Domingo Dalí ),就曾經繪製過類似的圖像

Manovich 做了一個精闢的區分:

AI 擅長「視覺上的超現實主義」
但抗拒「邏輯上的超現實主義」

達利式的怪誕圖像?可以。顛覆世界運作規則?很難。


AI 是透過學習「世界通常是什麼樣子」來運作的。

這讓 AI 從本質上成為了歷史上前衛藝術運動的對立面。前衛藝術的目標,正是要讓熟悉的事物變得陌生,打破既有的邏輯與視覺慣例。而 AI 的傾向,卻是不斷把你拉回熟悉的地方

在視覺美學上,AI 也有強烈的保守傾向。AI 生成的圖像偏好 19 世紀學院派寫實主義的審美:理想化的光線、解剖上正確的人體、清晰的空間透視、精緻的表面質感。這是因為網路上這類型的圖像數量最多,訓練資料的統計分布造就了這種視覺偏好。

結果就是,AI 很少產生真正激進的新視覺形式,反而更擅長在已知的視覺模式中進行重組與變奏。



4️⃣會思考的媒介

加拿大傳播理論家麥克魯漢(Marshall McLuhan)說,媒介塑造人的思維方式。但 Manovich 主張 AI 帶來的是一個更根本的顛覆:

這是一個自己會思考的媒介。
A Medium That Thinks.

過去,電腦藝術也曾模擬人類思維的某些面向 — — if/then的條件邏輯,可以說是在模仿推理。但那些功能都必須由程式設計師明確寫入,而且是針對特定任務的。

AI 的不同之處在於:AI 的認知能力是內建的,而不需要外部程式化。

像是 Google Gmini,同一個模型可以生成圖像、分析圖像、解釋圖像、修改圖像,還能討論任何藝術作品,其分析深度往往超過大多數人類觀者。甚至能審視你自己的作品,指出構圖問題、視覺層次、色彩關係 — — 那些有經驗的藝術家可能直覺感受到但說不清楚的問題。

這是創作媒介史上的真正斷裂點。這倒不是說 AI 多有用,Manovich 認為:我們第一次遇到一個自己具有廣泛認知能力的創作工具。

ChatGPT 生成

ChatGPT 生成

5️⃣通曉所有媒介的媒介

AI 擁有對藝術史、視覺文化、創作技法的百科全書式知識。沒有任何媒介在歷史上曾經如此了解所有其他媒介。

Midlibrary 這個資源列出了 400 種「藝術技法」 — — 從刺子繡、法貝熱彩蛋到卡洛版印刷、中國水墨 — — 告訴 AI 圖像工具模擬任何一種,它基本上都能做到。同一個平台還列出了 1546 位藝術家的風格,從 Frans Hals(荷蘭黃金時代肖像畫家)到 Hilma af Klint(瑞典藝術家,被認為是西方藝術史上最早的重要抽像作品之一),從葛飾北齋到達文西,全都可以指定風格生成。

這不只是知識的堆砌。AI 還學會了創作的「實踐性知識」 — — 它知道戶外場景應該配什麼樣的環境音效,知道某種拍攝內容應該用什麼類型的虛擬鏡頭。這種「媒介認知」 — — 無數媒介作品中蘊含的實踐智慧 — — 已經被模型吸收並內化。



6️⃣風格與內容的糾纏

當然,這種百科全書式的知識,卻帶來了一個奇特的困境。

Manovich 舉例,當你在提示詞中指定某位藝術家的名字,AI 往往不「只會」模仿他的風格,還會不自覺地帶入他的內容。Manovich 稱其為 AI 創作過程的滲透效應(Bleed Effect)。

一旦你指定「北齋」,可能會連帶出現海浪或富士山;或是指定「蒙德里安」,幾乎必定出現紅黃藍的格子;指定「芙烈達.卡蘿」(墨西哥女畫家,畫作受到墨西哥自然及文化和個人經歷的影響),自畫像與花草就會入侵你的構圖,無論你的提示詞說的是別的什麼。

如同 Manovich 說的,這不是技術 bug,而是模型學習方式的必然結果。在 AI 的表示空間中,風格與內容是糾纏在一起的(the entanglement of style and content),無法乾淨地分離、純化

日本江戶時代末期藝術家葛氏北齋。來源:維基百科

日本江戶時代末期藝術家葛氏北齋。來源:維基百科

有一些方法可以部分緩解這個問題。比如 Midjourney 的「風格參考」功能( — sref),讓用戶提供一張參考圖片而非藝術家名字。模型會從圖片本身提取色彩、質感、線條、構圖等視覺特質,而不會觸發名字背後的內容聯想網絡。

這樣,你更可能得到用北齋視覺語言呈現的城市街道,而不是海浪和富士山。但更深的問題仍然存在:「風格」本身就是一個複雜的概念。

大多數藝術家的風格都隨著生涯演進而改變 — — 梵谷的巴黎時期、阿爾勒時期、奧維爾時期,風格各有不同。AI模仿某位藝術家,通常是在取這些不同風格的平均值,或者鎖定在他最著名的那些作品上

還有一個更有趣的問題:前現代的歐洲和東亞繪畫,常常在同一幅畫中包含多種不同的「風格」 。臉部和手部精細描繪,服飾和景色卻採用概略的筆法。這種有意為之的風格層次分布,AI 幾乎無法複製。

目前的 AI 只能捕捉圖像的平均特性,卻無法理解這種刻意的風格層次。這也是為什麼 AI 生成的圖像往往感覺過於均質 — — 整幅畫的筆觸、質感、細節程度都一模一樣。



人與創作過程的關係

Manovich 在結論中提出了一個他認為最重要、也仍然開放的問題:

生成式 AI 作為媒介,究竟讓什麼樣的藝術成為可能,而這些藝術是之前所有媒介都無法實現的?

他沒有給出明確的答案。但 Manovich也提出了一個解構性的反問:電腦從設計之初,就是為了模擬現有的媒介和認知操作(計算、索引、摘要、搜尋)。

那麼,我們為什麼要期待 AI 有所不同

我們對 AI 創新性的期待,也許本身就是文化慣性的產物 — — 現代主義百年以來「必須創新」的窠臼,已經如此深入我們的思維,以至於我們不由自主地把這個標準投射到每一種新工具上。

但也許,AI 帶來的真正革命,創作中能生成什麼樣的圖像根本不重要,AI 改變的是人與創作過程的關係 — — 那個介於控制與放棄控制之間、介於意圖與驚喜之間、介於人類思維與機器認知之間的奇妙地帶。

那裡,可能才是真正值得探索的疆域。

留言
avatar-img
社會人的哲學沉思
190會員
351內容數
從物理到電機工程再轉到資訊傳播,最後落腳在社會學。衣櫃拿來當書櫃擺的人。我常在媒介生態學、傳播理論、社會學、心理學、哲學游移;期盼有天無產階級可以推倒資本主義的高牆的兼職家教。
2026/04/28
冰箱並沒有讓食物「活」得更久,冰箱只是讓我們更晚承認食物正在變質。
Thumbnail
2026/04/28
冰箱並沒有讓食物「活」得更久,冰箱只是讓我們更晚承認食物正在變質。
Thumbnail
2026/04/24
與 AI 互動更像是在教導或指導一個人,會有來回溝通、重複查核,而不是在操作一個穩定精確的系統。
Thumbnail
2026/04/24
與 AI 互動更像是在教導或指導一個人,會有來回溝通、重複查核,而不是在操作一個穩定精確的系統。
Thumbnail
2026/04/21
直至目前(2026 年 4 月)訴訟仍在進行中,但 Anthropic 獲得部分聯邦法院的支持,承審法官認定,這場由政府發起的訴訟更像是一場文化戰爭,而非合約糾紛。
Thumbnail
2026/04/21
直至目前(2026 年 4 月)訴訟仍在進行中,但 Anthropic 獲得部分聯邦法院的支持,承審法官認定,這場由政府發起的訴訟更像是一場文化戰爭,而非合約糾紛。
Thumbnail
看更多
你可能也想看
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
2035年,腦機介面普及引發社會「驚恐與憂思」量子糾纏浪潮。高感性社交圈充斥情緒風暴,易理師易未央結合五行輪迴與AI技術,引導社會從虛擬療癒邁向銀河永續新世界。
Thumbnail
2035年,腦機介面普及引發社會「驚恐與憂思」量子糾纏浪潮。高感性社交圈充斥情緒風暴,易理師易未央結合五行輪迴與AI技術,引導社會從虛擬療癒邁向銀河永續新世界。
Thumbnail
2026年,AI社交平台Moltbook宣布一條殘酷規則:人類只能旁觀,不得發言。140萬個AI代理人在平台上自發生成宗教、辯論治理、彼此欺騙。這不只是技術奇觀,而是一場存有論的震盪:當AI的符號運作缺乏死亡的重量、社交沒有失去的風險、行動沒有靈魂的承擔,我們還能用什麼準則說它們「不是生命」?
Thumbnail
2026年,AI社交平台Moltbook宣布一條殘酷規則:人類只能旁觀,不得發言。140萬個AI代理人在平台上自發生成宗教、辯論治理、彼此欺騙。這不只是技術奇觀,而是一場存有論的震盪:當AI的符號運作缺乏死亡的重量、社交沒有失去的風險、行動沒有靈魂的承擔,我們還能用什麼準則說它們「不是生命」?
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
關於簡立峰教授的演講,網路上已有很多心得分享與整理,只能說內容精采,有笑點也有讓人停下來思考的段落。趁著 2025 年還沒結束,趕快把 youtube 影片補完。 看完之後,腦中浮現的不是單一結論,而是一連串交錯的感受,有對改變的憂慮,也有對未知可能性的期待。 這篇筆記,更多是想透過整理演講中的
Thumbnail
關於簡立峰教授的演講,網路上已有很多心得分享與整理,只能說內容精采,有笑點也有讓人停下來思考的段落。趁著 2025 年還沒結束,趕快把 youtube 影片補完。 看完之後,腦中浮現的不是單一結論,而是一連串交錯的感受,有對改變的憂慮,也有對未知可能性的期待。 這篇筆記,更多是想透過整理演講中的
Thumbnail
認識袁人偉教授:用科技思維思考人文世界 提到人工智慧,我們很容易把它想成冰冷、理性的數據與演算法。但在袁人偉教授的眼中,AI應該有溫度,應該懂人性。這位同時活躍於學術與產業界的AI專家,長年倡導一件事——科技與人文,必須對話。 學術與產業的雙重角色 袁教授不只是科技研究者,更是一位「思辨者
Thumbnail
認識袁人偉教授:用科技思維思考人文世界 提到人工智慧,我們很容易把它想成冰冷、理性的數據與演算法。但在袁人偉教授的眼中,AI應該有溫度,應該懂人性。這位同時活躍於學術與產業界的AI專家,長年倡導一件事——科技與人文,必須對話。 學術與產業的雙重角色 袁教授不只是科技研究者,更是一位「思辨者
Thumbnail
  OpenAI在近日的研究中指出,AI幻覺的普遍發生,與標準的訓練和評估方式有關。相關的測驗與評比過份著重於回答的「準確率」,而沒有充分考慮「自信的嚴重錯誤」與「承認無知」之間的差異。這導致AI更傾向於猜答案而非承認自己不知道。因為只要猜測就有機率猜對,承認不知道則無異於放棄,讓成功率直接歸零。
Thumbnail
  OpenAI在近日的研究中指出,AI幻覺的普遍發生,與標準的訓練和評估方式有關。相關的測驗與評比過份著重於回答的「準確率」,而沒有充分考慮「自信的嚴重錯誤」與「承認無知」之間的差異。這導致AI更傾向於猜答案而非承認自己不知道。因為只要猜測就有機率猜對,承認不知道則無異於放棄,讓成功率直接歸零。
Thumbnail
我則認為呢, 就算 AI 可以做任何事情, 不代表金融跟貨幣會消失, 這樣可能會讓目前很多兢兢業業做好自己工作的人失業。 當工作缺發 「創造力、行銷力、科技力」就非常有可能被 AI 所取代, 但是生活還是要花費金錢 所以人必須賺錢生活這件事情並不會消失,只是想要讓人掏錢出來變得更難
Thumbnail
我則認為呢, 就算 AI 可以做任何事情, 不代表金融跟貨幣會消失, 這樣可能會讓目前很多兢兢業業做好自己工作的人失業。 當工作缺發 「創造力、行銷力、科技力」就非常有可能被 AI 所取代, 但是生活還是要花費金錢 所以人必須賺錢生活這件事情並不會消失,只是想要讓人掏錢出來變得更難
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
香吉士一家人:墨西哥底層生活紀實*,作者為Oscar Lewis,該書出版於1961年(田野資料大概在1950年代蒐集)。可以想見,錄音機可是新科技。
Thumbnail
香吉士一家人:墨西哥底層生活紀實*,作者為Oscar Lewis,該書出版於1961年(田野資料大概在1950年代蒐集)。可以想見,錄音機可是新科技。
Thumbnail
本文探討哈拉瑞新書《連結》的核心概念,資訊網路。從人類早期口耳相傳到現代科技的發展,資訊網路的正確性、自我修正機制、以及其與社會政體的關係都受到探討。此外,文章也著重於AI人工智慧帶來的衝擊,以及人類如何因應AI對於資訊網路和主體現實的影響。
Thumbnail
本文探討哈拉瑞新書《連結》的核心概念,資訊網路。從人類早期口耳相傳到現代科技的發展,資訊網路的正確性、自我修正機制、以及其與社會政體的關係都受到探討。此外,文章也著重於AI人工智慧帶來的衝擊,以及人類如何因應AI對於資訊網路和主體現實的影響。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News