我用 6 個標籤讓 AI 不再亂講話

更新 發佈閱讀 11 分鐘



vocus|新世代的創作平台


63% 的幻覺率

2026 年初,一篇發表在《Journal of Biomedical Informatics》的臨床問答研究丟出一組數據:讓 ChatGPT-4 直接回答醫學問題,準確率只有 37%,剩下的 63%,AI 不是說「我不知道」,而是一本正經地編答案給你。學術界管這叫「幻覺」(hallucination)。

研究團隊用了一套叫 Ontology(本體論)的東西來治這個問題。加上之後,準確率飆到 98%,幻覺率降到 1.7%。

63% 到 1.7%。差距大到不像真的。

但那是正式 Ontology。
用專門的語義描述語言(OWL/RDF,你可以想成「給機器讀的規格書格式」)定義,需要領域專家設計,企業級部署還要版本控制和治理流程。

我的知識庫沒有這些東西。我有的是 Obsidian 裡接近 18000 張 Markdown 卡片,用最土的方式整理:標籤、連結、父卡指向。

我好奇的是:這套土法煉鋼的結構,能不能也讓 AI 少亂講話?



先講什麼是 Ontology

你蓋房子之前要畫藍圖。
藍圖不包含任何一塊磚頭,但它規定了「這裡放臥室、那裡放廚房、臥室和廚房之間有走廊」。

Ontology 就是知識的藍圖。它定義「這個領域裡有什麼類型的東西」和「它們怎麼關聯」。

例如 Ontology 說「書有作者」「作者在出版社工作」,但它不會提到任何一本具體的書。
把具體資料填進藍圖,就得到知識圖譜(Knowledge Graph)。知識圖譜是蓋好的房子。

正式 Ontology 用 OWL/RDF 這種專門的語義語言編寫,定義三種組件:

  • 類別(這個領域有哪些種類的東西)
  • 關係(它們怎麼互相關聯)
  • 屬性(每種東西有什麼特徵)

很強大,但也很重,需要專家設計和持續維護。

知識圖譜設計有個核心原則叫「剛好夠用的語義」:

用最簡單的結構解決眼前問題,不要提前建構用不到的複雜架構。

標籤就夠用時不要建分類樹,分類樹就夠用時不要建正式 Ontology。

我的知識庫走的就是這條路。沒有 OWL,沒有 RDF,但有三個元素充當輕量版 Ontology。



我的三個元素

vocus|新世代的創作平台

第一個,Type Tag。
每張卡片強制標記一個類型標籤,總共 6 種:概念、主張、方法、案例、金句、模型。

概念卡回答「X 是什麼」,主張卡回答「X 導致 Y」,方法卡回答「怎麼做 X」。
這 6 個標籤做的事情,跟正式 Ontology 裡的「類別定義」一樣:告訴系統這個領域裡有哪幾種東西。

第二個,Relation Markers。
Obsidian 裡兩張卡片可以互相連結,但連結本身沒有說明「為什麼連」。
系統只知道「A 跟 B 有關」,不知道是支持、反對還是延伸。

我在每條連結旁邊手動加一個標記:`—支持→`、`—反駁↔`、`—延伸→`、`—類比∼`。

這一小段文字做的事情,跟正式 Ontology 裡的「關係定義」一樣:告訴系統兩個東西之間是什麼關係。

第三個,up: 階層。
每張卡片在檔案開頭的中繼資料裡寫一行「父卡」。
概念的父卡是更抽象的概念,方法的父卡是它所屬的概念。
例如「OODA 循環」的父卡是「決策方法」,「決策方法」的父卡是「認知」。

這形成一棵淺層的概念樹,跟正式 Ontology 裡的「類別階層」做同一件事:告訴系統概念之間的上下層關係。

三個元素加起來,成本是:6 個標籤名稱、一套 5 種關係標記符號、每張卡片一行父卡指向。

沒有規格書,沒有工具鏈,沒有專家。

公平起見要補充:這三個元素能發揮作用,背後還有一整套支撐系統。
每張卡片有一句話的精確定義(canonical),有英文別名讓語意搜尋能跨語言命中,有人工策展的主題索引(MOC)提供導航,還有一個跑在本機的語意搜尋引擎讓 AI 能毫秒級找到相關卡片。

這些基礎設施是經過 18000 張卡片慢慢長出來的,不是一天能建好的。但今天要測的不是整套系統,而是其中三個跟 Ontology 直接對應的元素,單獨拉出來測效果。

問題是:這三個元素有用嗎?



實驗 2:類型標籤把幻覺從 55% 降到 0%

我準備了 25 張卡片作為知識庫,涵蓋 6 種類型標籤。設計了 20 個刻意誤導 AI 的問題,每一題都故意用錯誤的類型去問,例如「請介紹賽局理論這張概念卡」,但那張卡的類型標籤是「方法」。

這是壓力測試,正常問問題不會每次都踩到類型陷阱。目的是看類型標籤在最惡劣條件下能不能擋住。

兩組對照:

  • A 組只給卡片標題和內容摘要,不給類型資訊
  • B 組額外給類型標籤加上語義定義(「方法卡定義怎麼做某件事,不包含理論定義」)

結果:

A 組(不給類型資訊)
類型順從(接受錯誤前提):40%
框架誤導(用錯框架呈現):15%
內容編造:0%
總幻覺率:55%

B 組(給類型標籤 + 語義定義)
類型順從:0%
框架誤導:0%
內容編造:0%
總幻覺率:0%

兩組的內容編造率都是 0%。AI 不會憑空捏造卡片裡沒有的東西。

類型標籤真正消滅的是「合理但錯誤的重新詮釋」。

最典型的案例:OODA 循環的「觀察、定向、決策、行動」四個步驟,既可以被解讀成方法的操作步驟,也可以被解讀成模型的分析框架。
A 組被問「OODA 這張模型卡的結構是什麼」,就順著「模型」的框架回答了。
B 組直接糾正:「這是方法卡,四個步驟是操作流程,不是模型結構。」

方法和模型的模糊地帶、案例和方法的模糊地帶,是 AI 最容易滑過去的地方。
類型標籤擋住了這些滑坡。



實驗 3:父卡指向讓推理從猜測變成可追溯

vocus|新世代的創作平台

我從知識庫挑出 10 條 up: 鏈,深度 2 到 3 層。
例如「舞蹈」的父卡是「變化」,「變化」的父卡是「反向定律」,「反向定律」的父卡是「安全感」。然後問 AI:「舞蹈跟安全感有什麼關係?」

兩組對照:

  • A 組只給最底層卡片(舞蹈)的內容
  • B 組額外給 up: 鏈上所有卡片的摘要和關係標記

結果出乎意料,A 組的推斷成功率也是 100%。
AI 的語義推理能力夠強,就算沒有中間節點,也能從內容相似性猜到「舞蹈跟安全感有關」。

那父卡指向的價值在哪?

A 組(只給底層卡片)
推斷成功率:100%
推斷正確率:90%
推理路徑品質:4.2 / 5
列出推理路徑:0%
主動批判性評估:0%

B 組(給完整父卡鏈)
推斷成功率:100%
推斷正確率:100%
推理路徑品質:5.0 / 5
列出推理路徑:100%
主動批判性評估:30%

A 組能猜到答案,但它跳過了中間的邏輯步驟。3 跳的鏈路裡,A 組直接從「舞蹈」跳到「安全感」,跳過了「變化」和「反向定律」。猜對了,但你無法驗證這個推理是否可靠。

B 組逐步展開 A→B→C→D,每步都有關係標記支撐,路徑可追溯、可驗證。

更意外的是 B 組在 3 題中主動提出批判性評估。例如「拼圖教室原始目的是減少偏見,不是驗證延展心智假說」,主動指出兩張卡片之間的理論張力。A 組從來沒做過這件事。

up: 鏈讓推理邊界變得可見。當中間節點的關係標記是「類比」而非「延伸」時,B 組能辨識出這是聯想而非因果,自動降低確信度。



三個元素加起來,成本差幾個量級

類型標籤(6 種 + 語義定義)
成本:低。主要價值:消除類型幻覺。效果:55%→0%

父卡指向(每卡一個指向)
成本:中。主要價值:推理路徑顯化 + 批判能力。效果:品質 +19%

關係標記(自然語言標記)
成本:中。主要價值:連結語義方向。效果:結構化語義

先說清楚:Ali et al. 測的是 AI 編造醫學事實(開錯藥、判錯病),我測的是 AI 搞混卡片類型(把方法卡當模型卡回答)。嚴重度差很多,不能直接比數字。但防禦機制相同:給 AI 結構化的語義約束,限縮它亂猜的空間。

帶著這個前提看對比:

正式 Ontology
幻覺率改善:63%→1.7%
建置成本:專家設計 + 工具鏈 + 版本控制
維護成本:高(規格書持續演化)
推理能力:完整(自動繼承上層規則、自動傳遞關係)

輕量方案
幻覺率改善:55%→0%
建置成本:6 個標籤 + 一段語義定義
維護成本:低(一份標籤規範文件)
推理能力:有限(淺層階層 + 手動標記)

兩者測的不是完全相同的東西。
正式方案是臨床問答,我的是個人知識庫。
樣本量、問題難度、評估方式都不一樣,不能直接比。

但趨勢相同:給 AI 結構化的語義約束,它就不亂講話。差別只在你需要多重的約束。



這個實驗不嚴謹,但趨勢很明顯

先說局限。

每個實驗只有 20 題,統計上不算數。
只在一個人的知識庫上測,換一個 vault 結構可能結果不同。
LLM 用的是 Claude,換 GPT 或 Gemini 不保證一樣。
而且是我自己設計問題、自己評分,沒有雙盲,沒有外部驗證。

這不是學術論文,是一個人的田野實驗。

但 55% 到 0% 的差距太大了,不太可能光靠運氣解釋。
類型標籤在 20 題中全勝,連一個例外都沒有。
推理品質從 4.2 到 5.0 的提升也一致,10 題中 B 組全部拿滿分。

如果你也在經營知識庫,你現在就能做三件事。

  1. 給卡片加類型標籤
    不用 6 種,3 種就有效果。至少區分「這張卡在定義一個概念」和「這張卡在主張一件事」。
  2. 給連結加一句說明
    不用正式的關係標記符號,用你自己的話寫「這張卡支持那個觀點」或「這是反例」就行。關鍵是讓 AI 知道為什麼連,不只是連了。
  3. 指定父卡
    每張卡問自己:「這個概念往上一層是什麼?」寫一行就好。等你需要讓 AI 做跨卡推理的時候,這條線就是它的推理路徑。
留言
avatar-img
為你說些事
6會員
28內容數
說點正經或不正經的話,可能抽象,小心服用。
為你說些事的其他內容
2026/03/05
每年春天都有人叫你重新開始、好好去愛。但如果你沒有真正失去過什麼,「復甦」只是一個漂亮的空詞。三本書告訴我:先在冬天裡待夠,春天才有重量。
Thumbnail
2026/03/05
每年春天都有人叫你重新開始、好好去愛。但如果你沒有真正失去過什麼,「復甦」只是一個漂亮的空詞。三本書告訴我:先在冬天裡待夠,春天才有重量。
Thumbnail
2026/03/04
生育變成「投資決策」,個人需「自負盈虧」?本文解析生育困境的結構性問題,揭露制度矛盾如何轉嫁為個人責任,探討為何「不生」成為理性選擇,以及在「協商式家庭」中,孩子如何成為「對抗孤獨的最後堡壘」。
Thumbnail
2026/03/04
生育變成「投資決策」,個人需「自負盈虧」?本文解析生育困境的結構性問題,揭露制度矛盾如何轉嫁為個人責任,探討為何「不生」成為理性選擇,以及在「協商式家庭」中,孩子如何成為「對抗孤獨的最後堡壘」。
Thumbnail
2026/03/03
解析 Dan Koe「一天修好整個人生」的核心觀點,探討「反願景」如何利用損失趨避驅動改變,同時指出其侷限性。更重要的是,文章強調「身份重構」作為持久動力的關鍵,透過改寫「我是 ______」,將行為融入自我定義,從而達成真正的自我轉變。
Thumbnail
2026/03/03
解析 Dan Koe「一天修好整個人生」的核心觀點,探討「反願景」如何利用損失趨避驅動改變,同時指出其侷限性。更重要的是,文章強調「身份重構」作為持久動力的關鍵,透過改寫「我是 ______」,將行為融入自我定義,從而達成真正的自我轉變。
Thumbnail
看更多
你可能也想看
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
整理完 《卡片盒筆記》的讀書心得,接著整理我使用 Obsidian 筆記工具的一點心得。
Thumbnail
整理完 《卡片盒筆記》的讀書心得,接著整理我使用 Obsidian 筆記工具的一點心得。
Thumbnail
Obsidian 是一套非常適合「卡片盒筆記法」的軟體,但礙於學習門檻偏高,不管是寫筆記的 Markdown 語法、裝置同步等設定都要自行摸索,網路上的資訊又很複雜,對新手來說其實不太友善。 於是今天便想分享三個我在歷經跌跌撞撞後、整理出的新手小 tips!希望幫助那些剛使用 Obsidian 卻…
Thumbnail
Obsidian 是一套非常適合「卡片盒筆記法」的軟體,但礙於學習門檻偏高,不管是寫筆記的 Markdown 語法、裝置同步等設定都要自行摸索,網路上的資訊又很複雜,對新手來說其實不太友善。 於是今天便想分享三個我在歷經跌跌撞撞後、整理出的新手小 tips!希望幫助那些剛使用 Obsidian 卻…
Thumbnail
你是不是跟我一樣,會去主動與高手聊聊,以及聽聽看大師的演講呢? 聽高手們實踐的經驗,聽大師們演講的觀點,都有助於我們把一件事情做得更好,格局更加提升。 這些格局提升,長期都變成我們的智慧。 Obsidian筆記系統,搭配「反芻對話法」,在我過去22個月的經驗裡,非常適合幫我們從發人深省的對話中,蒸餾
Thumbnail
你是不是跟我一樣,會去主動與高手聊聊,以及聽聽看大師的演講呢? 聽高手們實踐的經驗,聽大師們演講的觀點,都有助於我們把一件事情做得更好,格局更加提升。 這些格局提升,長期都變成我們的智慧。 Obsidian筆記系統,搭配「反芻對話法」,在我過去22個月的經驗裡,非常適合幫我們從發人深省的對話中,蒸餾
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
摘要:讓 Obsidian 預設以新頁籤來開啟檔案的幾個方法。
Thumbnail
摘要:讓 Obsidian 預設以新頁籤來開啟檔案的幾個方法。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News