[科普] 智能的長征:從齒輪、像素到理解世界的空間智慧

更新 發佈閱讀 5 分鐘

——從李飛飛的演講,看人工智慧的真正方向

作者: 成大電機蘇淑茵教授

當我們談論人工智慧時,許多人腦海中浮現的是聊天機器人的流暢對話,或大型語言模型生成的精美圖片。然而,若將時間軸拉長,人工智慧並不是一場突然降臨的技術奇蹟。它其實是人類數千年來一場持續進行的思想工程——一場將「腦中的規則與理解」外化為機械與系統的長征。
vocus|新世代的創作平台

一、當思考變成規則:邏輯的誕生

這段歷史可以追溯到古希臘時期。亞里斯多德(Aristotle)提出「三段論法」,嘗試把模糊的人類直覺轉化為可推演的邏輯結構。這是一個關鍵轉折:若思考可以被形式化為規則,那麼它是否也能被機械執行?

vocus|新世代的創作平台

到了中世紀,機械鐘錶出現。時間不再只依賴天體觀察,而由齒輪與擺錘精確計算。人類第一次將抽象的認知功能(計時與測量),交給金屬與機械完成。智慧,開始了它的「外化」歷程 。

二、符號的力量:機器不只算數

19 世紀,愛達.洛夫萊斯(Ada Lovelace)在為巴貝奇分析機撰寫註解時,提出了一個革命性的洞見:機器處理的並不只是數字,而是「符號」。只要音樂、文字或圖像能被編碼為符號,機器便能對其進行運算與創造。

vocus|新世代的創作平台

20 世紀中葉,艾倫.圖靈(Alan Turing)進一步以數學方式定義「可計算性」,並提出「機器能否思考」的哲學與科學考問。人工智慧由此成為一門正式學科。這條脈絡告訴我們:AI 絕非橫空出世,而是長期邏輯化與形式化思考的自然延伸 。

三、當機器學會看:視覺革命

然而,早期的人工智慧雖然擅長符號計算,卻對物理世界「視而不見」。2000 年代,李飛飛(Fei-Fei Li)意識到:若沒有大規模視覺資料,機器不可能真正理解世界。她推動建立了 ImageNet,收集並標註了數千萬張影像資料。

vocus|新世代的創作平台

2012 年,深度神經網路在 ImageNet 競賽中取得大幅突破,結合 NVIDIA GPU 的運算能力,正式開啟深度學習的浪潮。這不僅是技術的進步,更是感知能力的躍遷——AI 從抽象的符號計算,走向對現實世界的辨識與理解 。

四、語言之外:走向空間智慧

近年來,大型語言模型引發全球關注。然而,李飛飛在 2024 年的 TED 演講中提醒社會:語言能力並非智慧的全部。她指出,真正通向通用人工智慧(AGI)的關鍵,在於「空間智慧」(Spatial Intelligence)。

視覺在地球生命演化中已有約 5.4 億年歷史,而語言僅約 50 萬年。人類理解世界,首先依賴的是對三維空間、物理因果與行動決策的掌握。空間智慧意味著機器不只是「描述」世界,而是「理解」世界:知道杯子傾倒會流出水,知道門在空間中的位置,知道如何避開障礙、走入房間。這是一種進入「物理世界」的智慧,而非停留在螢幕上的文字生成 。

結語:科技是人類能力的延伸

將人工智慧等同於語言模型,是對這段漫長歷史的過度簡化。從亞里斯多德的邏輯規則到洛夫萊斯的符號洞見;從圖靈的數學框架到 ImageNet 的視覺革命,再到今日關於空間智慧的討論——這是一場跨越數千年的思想延續。

科技的目標從來不是取代人類,而是延伸人類的能力邊界。人工智慧真正的意義,不在於它能否說話像人,而在於它是否能與我們一起理解世界。而這條長征,仍在繼續。

【參考文獻】

  1. Aristotle. Prior Analytics (Part of the Organon), c. 350 BC.
  2. Lovelace, A. A. (1843). "Notes by the Translator" to L. F. Menabrea's "Sketch of the Analytical Engine Invented by Charles Babbage."
  3. Turing, A. M. (1950). "Computing Machinery and Intelligence." Mind, 59(236), 433-460.
  4. Li, F. F. (2024, April). "With spatial intelligence, AI will understand the real world." TED Talk.
  5. Li, F. F. (2023). The Worlds I See: Curiosity, Hope, and AI-Powered Discovery. Flatiron Books.
留言
avatar-img
教授媽媽的教育實踐筆記的沙龍
2會員
18內容數
我是大學電機系教授, 巳累積20年教學經驗, 希望藉由自己當教師與家長的角度, 分享自己的教育心得
2026/02/22
本文作者強調AI是思考輔助器,負責邏輯與重複;人類則須掌握價值、方向與最終判斷力。文章建議學生透過「每日整理內容、每週拆解問題、每學期完成真實專案」的三步驟,將AI融入日常學習。鼓勵各領域學生善用AI放大自身專業,成為主動駕馭AI的人才,而非時代的旁觀者。
2026/02/22
本文作者強調AI是思考輔助器,負責邏輯與重複;人類則須掌握價值、方向與最終判斷力。文章建議學生透過「每日整理內容、每週拆解問題、每學期完成真實專案」的三步驟,將AI融入日常學習。鼓勵各領域學生善用AI放大自身專業,成為主動駕馭AI的人才,而非時代的旁觀者。
2026/02/16
這篇文章提供了一份從國小到大學的學習健檢清單,協助家長檢視孩子的學習地基。作者強調,穩固的地基在於孩子是否曾經歷「卡關、自我突破、並解釋給別人聽」的過程,而非單純的考試分數。
Thumbnail
2026/02/16
這篇文章提供了一份從國小到大學的學習健檢清單,協助家長檢視孩子的學習地基。作者強調,穩固的地基在於孩子是否曾經歷「卡關、自我突破、並解釋給別人聽」的過程,而非單純的考試分數。
Thumbnail
2026/02/16
在台灣,教育焦慮常常體現在「速度」上。這篇文章探討在台灣追求「超前學習」的教育焦慮下,家長應建立的正確「未來學習觀」。
Thumbnail
2026/02/16
在台灣,教育焦慮常常體現在「速度」上。這篇文章探討在台灣追求「超前學習」的教育焦慮下,家長應建立的正確「未來學習觀」。
Thumbnail
看更多
你可能也想看
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文介紹2025年最受歡迎的AI程式語言,包括Python、Java、JavaScript、Rust和R,並提供各語言的學習資源連結。
Thumbnail
本文介紹2025年最受歡迎的AI程式語言,包括Python、Java、JavaScript、Rust和R,並提供各語言的學習資源連結。
Thumbnail
目標 ✅ 建立 FastAPI API,讓應用可以透過 REST API 進行 LLM 查詢 ✅ 結合 RAG 技術,提高 LLM 回應的準確度 ✅ 存入及查詢 FAISS 向量資料庫,讓 LLM 檢索外部知識庫
Thumbnail
目標 ✅ 建立 FastAPI API,讓應用可以透過 REST API 進行 LLM 查詢 ✅ 結合 RAG 技術,提高 LLM 回應的準確度 ✅ 存入及查詢 FAISS 向量資料庫,讓 LLM 檢索外部知識庫
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
您是否常在會議中聽到 AI、機器學習、深度學習、生成式 AI、LLM 等名詞,卻感到混淆?本文將透過由外而內的五個同心圓,清晰地解釋這些名詞的定義、彼此之間的層級關係,以及它們的學習方式(監督學習、非監督學習、強化學習)。無論您是技術背景或非技術背景,都能藉此快速釐清概念,更精準地與他人溝通。
Thumbnail
您是否常在會議中聽到 AI、機器學習、深度學習、生成式 AI、LLM 等名詞,卻感到混淆?本文將透過由外而內的五個同心圓,清晰地解釋這些名詞的定義、彼此之間的層級關係,以及它們的學習方式(監督學習、非監督學習、強化學習)。無論您是技術背景或非技術背景,都能藉此快速釐清概念,更精準地與他人溝通。
Thumbnail
隨著量子計算與機器學習的融合,Quantinuum正在推動量子生成AI 的發展,特別是在自然語言處理(NLP)領域。利用量子特性,開發更高效的 AI 模型,顯著降低計算成本與能源消耗。並與軟銀合作,探索量子數據中心及實際應用,推動量子技術的商業化。有望突破AI 技術瓶頸,加速量子 AI 時代的到來。
Thumbnail
隨著量子計算與機器學習的融合,Quantinuum正在推動量子生成AI 的發展,特別是在自然語言處理(NLP)領域。利用量子特性,開發更高效的 AI 模型,顯著降低計算成本與能源消耗。並與軟銀合作,探索量子數據中心及實際應用,推動量子技術的商業化。有望突破AI 技術瓶頸,加速量子 AI 時代的到來。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News