人類的視覺並非如攝影機般被動紀錄世界,而是一套極度精密、由下而上(Bottom-up)的階層式資訊處理系統。光學訊號在視網膜轉換為電訊號後,大腦必須經歷降維拆解、特徵提取、深度計算,最終才能重新渲染出我們主觀感知的 3D 動態世界。
理解這套視覺硬體的運作與發現過程,不僅是認知神經科學的核心,更是探討大腦神經可塑性(Neuroplasticity)與視覺重建的關鍵基石。本文將完整梳理視覺訊號從初級視覺皮層(V1)到高階分流(腹側流與背側流)的處理邏輯與歷史性實驗。
第一階段:V1 的特徵萃取與 Hubel & Wiesel 的偶然突破
大腦並不懂得什麼是「蘋果」或「人臉」,初級視覺皮層(V1)只負責最底層的幾何運算。
實驗發現:貓的視覺皮層與邊緣檢測
在 1950 年代前,科學界誤以為大腦是逐點(pixel-by-pixel)解析影像。1959 年,神經科學家 David Hubel 和 Torsten Wiesel 將微電極植入麻醉貓的 V1 區域,試圖用不同大小的光點刺激神經元,卻毫無斬獲。直到替換幻燈片時,玻璃邊緣在視網膜上產生了一道移動的「黑白交界線」,瞬間引發了神經元的劇烈放電。
這項實驗證實,V1 神經元是具備「方向選擇性」的特徵提取器(類似電腦視覺中的 Gabor 濾波器)。訊號進入 V1 後,畫面被徹底摧毀,降維成無數個數學向量:特定的傾斜角度、空間頻率(粗細)與對比度邊界。
🔗 文獻參考:
Receptive fields of single neurones in the cat's striate cortex (1959)
奠定現代視覺神經科學基礎,兩人因此獲 1981 年諾貝爾獎。
第二階段:V2 與 V3 的幾何縫合與立體視差
破碎的線條必須被重新組裝。當訊號離開 V1 進入紋外皮層(Extrastriate Cortex)的 V2 與 V3 時,大腦開始建立空間關係。
V2:立體視覺(Stereopsis)與輪廓腦補的誕生
V1 的神經元多數只處理單眼訊號。進入 V2 後,雙眼的視神經網路開始深度交匯。V2 神經元負責計算兩眼視網膜成像的微小幾何位移——即雙眼視差(Binocular Disparity)。大腦利用這個微小的數學落差,反向推算出物體的 Z 軸深度,這是人類擁有 3D 立體視覺的硬體前提。若大腦在發育關鍵期缺乏雙眼訊號的精準校疊,V2 的視差計算網路將無法正常發育,導致立體視覺喪失。此外,V2 還具備處理「錯覺輪廓」的能力,能將物理上不連續的線條縫合成完整的幾何形狀。
V3:動態形體的全局整合
V3 神經元的感受野更廣,不再糾結於局部邊緣。它將 V2 傳來的深度與輪廓資訊結合,開始處理大範圍的動態形狀(Dynamic Form),作為後續高階運算的數據分流樞紐。
第三階段:大腦的雙流假說(Two-Stream Hypothesis)
在 V1 到 V3 完成基礎物理訊號解析後,視覺數據面臨了最關鍵的分叉。大腦不再只問「這是什麼特徵」,而是將計算資源分為「認知」與「行動」兩條獨立高速公路。
實驗發現:Mishkin 與 Ungerleider 的獼猴大腦病變實驗
1983 年,Mortimer Mishkin 與 Leslie Ungerleider 透過破壞恆河猴(Macaque monkeys)大腦的不同區域,發現了視覺處理的雙軌制:
1. 切除顳葉(Temporal lobe)的猴子:無法分辨不同形狀的物體(失去辨識能力),但依然能準確判斷物體的位置。
2. 切除頂葉(Parietal lobe)的猴子:能輕易認出物體形狀,卻無法理解物體在哪裡,無法完成空間定位任務。
這項實驗確立了著名的雙流假說(Two-Stream Hypothesis):
• 腹側流(Ventral Stream / "What" Pathway):大腦的資料庫比對
• 路徑: V1 → V2 → V4 → 下顳葉(Inferior Temporal Cortex)。
• 邏輯: 專注於高解析度的細節、色彩與複雜形狀。最終與記憶系統連結,賦予畫面意義。這條路徑讓你知道眼前的是「一杯咖啡」或「一位老友」。
• 背側流(Dorsal Stream / "Where" or "How" Pathway):大腦的導航與運動引擎
• 路徑: V1 → V2 → V3 → V5 (MT) → 後頂葉(Posterior Parietal Cortex)。
• 邏輯: 對顏色與細節極度不敏感,只專注於高時間頻率的動態資訊。它計算物體在 3D 空間的絕對座標、移動方向與速度,並直接引導運動神經。這條路徑讓你在不具備清晰意識的情況下,本能地伸手接住一顆飛來的棒球。
🔗 文獻參考:
Object vision and spatial vision: two cortical pathways (1983)
首次明確提出視覺雙流假說的經典文獻。
結論:解構視覺,是為了重塑認知
人類的視覺並非渾然天成,而是一條從數學向量到物理空間,再到語意認知的嚴密生產線。從 Hubel & Wiesel 發現 V1 的邊緣檢測,到 Mishkin 確立 What 與 Where 的雙流架構,神經科學證實了主觀視覺是一場可以被拆解、被計算的大腦運算過程。
理解這套底層運算邏輯,意味著視覺不再是不可撼動的黑盒子。透過針對特定空間頻率、對比度或雙眼視差的精準刺激,我們完全有可能越過高階認知的幻覺,直接對底層視覺皮層進行重新寫入與神經重塑。這正是現代神經科學與知覺訓練,最核心的價值所在。













