🤖 1️⃣ 「機器會思考嗎?」—— 艾倫·圖靈 與圖靈測試
AI(人工智慧)發展過程中,其實充滿了故事、爭議、意外與哲學衝擊。下面整理艾倫·圖靈(Alan Turing)經典、有趣、也最具象徵意義的 AI 典故。
⭐ 典故
1950 年,圖靈提出一個問題:
「機器能思考嗎?」
他沒有直接定義「思考」,而是提出圖靈測試:
👉 若人類透過文字對話分不出對方是人或機器
👉 則機器就可視為「具智慧」
🎯 有趣點
- 這其實是哲學「語言行為主義」的應用
- AI 智慧被定義為可觀察行為
- 今天的大模型聊天 → 本質仍在挑戰圖靈測試
👉 可以說:現在各種AI 大模型聊天 就是圖靈測試的長期實驗
🤖 什麼是圖靈測試(Turing Test)?
圖靈測試是由英國數學家
Alan Turing
在 1950 年論文 Computing Machinery and Intelligence
中提出,用來回答一個核心問題
機器能思考嗎?
⭐ 基本概念(模仿遊戲)
圖靈沒有直接定義「思考」,而是提出一個實驗:
👤 角色
- 裁判(人類)
- 人類受試者
- 機器(AI)
💬 流程
- 裁判透過文字與兩方對話
- 不知道誰是人、誰是機器
- 若裁判無法可靠區分
👉 機器通過圖靈測試
這被稱為:
Imitation Game(模仿遊戲)
🎯 核心思想
圖靈的哲學重點是:
👉 不問「機器是否真正思考」
👉 改問「機器是否表現得像思考」
也就是:
行為主義式定義智能
🧠 為何重要
圖靈測試成為:
- AI 最早的 benchmark
- AI 哲學的起點
- 智能 operational definition
許多早期 AI 系統目標:
👉 讓人以為在跟人聊天
📜 著名嘗試案例
💬 ELIZA(1960s)
由
Joseph Weizenbaum
開發
👉 模擬心理醫師
👉 使用模板回覆 👉 部分使用者相信其理解
👉 早期圖靈測試效果
💬 Loebner Prize
競賽名稱:Loebner Prize
👉 每年舉辦
👉 評估 chatbot 人類相似度
⚖️ 批評與限制
1️⃣ 中文房間批評
John Searle 提出:
👉 通過測試 ≠ 理解
👉 只是符號操控
2️⃣ Anthropocentric
👉 以人類為標準
👉 不一定是唯一智能形式
3️⃣ Deception bias
👉 AI 可透過:
- 模糊回答
- 裝傻
- 社交策略
來通過測試
👉 不代表真正能力
⭐ 現代觀點
現在研究者通常認為:
👉 圖靈測試具有歷史與哲學價值
👉 但不是 AI 能力充分條件
現代 AI 評估更重視:
- reasoning benchmark
- multimodal ability
- planning ability
- world model
⭐ 一句話總結
圖靈測試不是測 AI 是否思考,而是測 AI 是否能「被當作在思考」。


















