付費限定

Golden Dataset:AI 專案成功的關鍵,為什麼你不能沒有它?

更新 發佈閱讀 8 分鐘

導入 AI 之前,大多數團隊準備的是規格書和 Use Case。但這些東西,AI 其實看不懂。

有一次我去跟 BU 說,我們這個專案需要建立一份 Golden Dataset,請他們協助提供標註好的歷史資料。

對方愣了一下,然後說:「這樣很麻煩耶,我們以前做系統的時候,給工程師幾個範例 case 不就好了嗎?」

這句話我聽過很多次。它背後反映的是一個很常見的認知落差,大家以為 Golden Dataset 只是「比較多的 Use Case」,但其實這兩件事的本質完全不同。


Use Case 和 Golden Dataset,根本是兩回事

傳統開發裡Use Case 是給工程師看的,它的目的是讓工程師理解業務邏輯,這個功能在什麼情境下會被觸發、使用者的操作流程是什麼、預期的系統行為是什麼、資料的樣態是什麼等等。本質上,Use Case 是一份給人讀的需求說明,縮短業務邏輯和開發中間的gap。

Golden Dataset 完全不一樣,它不是給人讀的,是給模型學習的。它的內容是大量真實的輸入資料,加上由業務專家人工標註過每一筆資料對應的正確答案。模型透過這份資料集學習「什麼樣的輸入應該對應什麼樣的輸出」,而不是透過你寫的規則去推論。

換句話說:Use Case 定義的是需求,Golden Dataset 定義的是答案。你可以沒有完整的規格書,但你不能沒有 Golden Dataset,因為沒有它,模型根本不知道什麼叫做「對」。


為什麼一定要由業務專家來標註?

這是我在推動 Golden Dataset 建立時最常遇到的阻力,BU 覺得標註資料是技術團隊的事,或是覺得這件事可以外包給不熟悉業務的人來做。

但這個認知是錯的,而且錯得很關鍵。

標註資料不是機械性的分類工作。標註的過程,本質上是在定義業務邏輯。當業務專家看著一筆資料,判斷它應該被標為類別 A 還是類別 B,他做的不只是貼標籤,他是在把自己腦袋裡多年累積的業務判斷,轉化成模型可以學習的訊號。

如果這個工作交給不懂業務的人來做,標出來的答案就會有偏差,模型學到的就是錯誤的邏輯。更糟的是,這種偏差很難被發現,因為模型的輸出看起來「好像還好」,但在真正重要的邊緣案例上會頻繁出錯。等到專案上線之後才發現問題,要回頭重新標註、重新訓練,成本遠比一開始就做對高得多。

所以當 BU 問「為什麼要我們自己來標」,我通常會這樣回答:「因為只有你們知道什麼才是正確答案。這份資料集,是你們業務知識的數位化,不是技術工作。


什麼才叫做好的 Golden Dataset?

光是「有標註資料」還不夠,標註的品質和結構決定了模型能學到什麼。幾個實務上的具體指標:

以行動支持創作者!付費即可解鎖
本篇內容共 3189 字、0 則留言,僅發佈於金融 x AI 轉型實務你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
留言
avatar-img
panyo腦洞大開
0會員
5內容數
你可能也想看
Thumbnail
華爾街股票分析師的榮景不再,AI 技術崛起與投資模式轉變衝擊產業,導致分析師職位減少、工作壓力增加。本文分析此現象的成因、影響,以及相關投資機會。
Thumbnail
華爾街股票分析師的榮景不再,AI 技術崛起與投資模式轉變衝擊產業,導致分析師職位減少、工作壓力增加。本文分析此現象的成因、影響,以及相關投資機會。
Thumbnail
當 AI 浪潮湧來,我們的法規與認知準備好了嗎? 過去這一年,生成式 AI 如同一場突如其來的海嘯,徹底重塑了我們的生活與工作樣貌。我們驚歎於 AI 繪圖、AI 寫作的高效率,同時也開始擔憂:這股力量該如何被規範? 許多人將目光聚焦在歐盟的《AI 法案》等全球性監管動態,認為這場法規競賽離我們還
Thumbnail
當 AI 浪潮湧來,我們的法規與認知準備好了嗎? 過去這一年,生成式 AI 如同一場突如其來的海嘯,徹底重塑了我們的生活與工作樣貌。我們驚歎於 AI 繪圖、AI 寫作的高效率,同時也開始擔憂:這股力量該如何被規範? 許多人將目光聚焦在歐盟的《AI 法案》等全球性監管動態,認為這場法規競賽離我們還
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
聯準會如預期維持利率不變,看好經濟展望轉強,支撐流動性信心。微軟用驚人的資本支出證明 AI 需求深不見底,特斯拉則靠能源部門讓毛利率重返榮耀,多項業務擴張顯現轉型曙光,然而,華府的預算僵局仍是揮之不去的陰影,隨著 1/30 停擺大限逼近,黃金價格持續攀升,顯示市場並未完全放下戒心。
Thumbnail
聯準會如預期維持利率不變,看好經濟展望轉強,支撐流動性信心。微軟用驚人的資本支出證明 AI 需求深不見底,特斯拉則靠能源部門讓毛利率重返榮耀,多項業務擴張顯現轉型曙光,然而,華府的預算僵局仍是揮之不去的陰影,隨著 1/30 停擺大限逼近,黃金價格持續攀升,顯示市場並未完全放下戒心。
Thumbnail
以DBS案例剖析其三波轉型策略,並帶領MA們深入探討數位轉型背後的挑戰與解決方案。工作坊採互動式教學,運用Mentimeter等工具,引導MA們從不同面向思考,例如:管理關鍵旅程(MtJs)、績效細胞(Performance Cell)的運作、AI投資預算分配,以及針對不同客群的數位解決方案設計。
Thumbnail
以DBS案例剖析其三波轉型策略,並帶領MA們深入探討數位轉型背後的挑戰與解決方案。工作坊採互動式教學,運用Mentimeter等工具,引導MA們從不同面向思考,例如:管理關鍵旅程(MtJs)、績效細胞(Performance Cell)的運作、AI投資預算分配,以及針對不同客群的數位解決方案設計。
Thumbnail
日本大多數老年人口仍偏好現金交易,然而無現金交易正在逐步上升,2023年達到126.7兆日圓。SmartBank支持日本政府推進無現金支付,並透過其預付卡及財務管理應用,滿足20、30歲及已婚夫婦的需求。隨著新資本的融入及AI技術的應用,SmartBank計劃擴大用戶基礎,成為綜合金融平臺。
Thumbnail
日本大多數老年人口仍偏好現金交易,然而無現金交易正在逐步上升,2023年達到126.7兆日圓。SmartBank支持日本政府推進無現金支付,並透過其預付卡及財務管理應用,滿足20、30歲及已婚夫婦的需求。隨著新資本的融入及AI技術的應用,SmartBank計劃擴大用戶基礎,成為綜合金融平臺。
Thumbnail
AEON效率+90%、Hana Bank 30分變10秒、HEYDI 9倍加速。5個企業AI Agent實戰案例告訴你:成功關鍵不是工具,是你給AI多少企業Context。台灣企業4步驟也能開始。
Thumbnail
AEON效率+90%、Hana Bank 30分變10秒、HEYDI 9倍加速。5個企業AI Agent實戰案例告訴你:成功關鍵不是工具,是你給AI多少企業Context。台灣企業4步驟也能開始。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
這篇文章深入探討AI技術在金融產業中的應用,特別是中信金控在臺北國際金融科技展中推出的創新應用,如「GPT ATM」和「AI客戶助理」。這些技術如何改變銀行業務,提升服務質量,以及防詐騙能力,並重點介紹未來金融服務的新趨勢和發展方向。文章還提供了持續關注金融科技的實用建議。
Thumbnail
這篇文章深入探討AI技術在金融產業中的應用,特別是中信金控在臺北國際金融科技展中推出的創新應用,如「GPT ATM」和「AI客戶助理」。這些技術如何改變銀行業務,提升服務質量,以及防詐騙能力,並重點介紹未來金融服務的新趨勢和發展方向。文章還提供了持續關注金融科技的實用建議。
Thumbnail
這是一場關於「控制權轉移」的賽局。蘋果看似退讓,實則透過引進 ChatGPT 與 Gemini,將 CarPlay 轉化為無法被車廠取代的「超級入口」;香港金管局則親自下場,將 AI 從輔助偵錯推向能自主成交的「代理商務」。而在創作端,字節跳動的 Seedance 2.0 正式消弭了分鏡師與配音員
Thumbnail
這是一場關於「控制權轉移」的賽局。蘋果看似退讓,實則透過引進 ChatGPT 與 Gemini,將 CarPlay 轉化為無法被車廠取代的「超級入口」;香港金管局則親自下場,將 AI 從輔助偵錯推向能自主成交的「代理商務」。而在創作端,字節跳動的 Seedance 2.0 正式消弭了分鏡師與配音員
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News