Let's learn how to analyze what you watch on youtube.
你有沒有想過,如果把過去一年看過的 YouTube 影片全部攤開,排在你面前,你會看見一個什麼樣的自己?
俗話說:「You are what you eat」,在數位時代,這句話或許該改成 「You are what you watch」。我們在通勤、吃飯、睡前消磨掉的影音片段,正悄悄塑造我們的思考邏輯。但我好奇的是:你真的了解自己的興趣嗎?還是你只是演算法餵養下的被動者?
受《決定未來的晚八點》啟發,我決定利用 AI 工具,對自己的觀看紀錄進行一場深度的「數據考古」。
1. 面對海量數據的挑戰:為什麼我們需要 ETL?
當我從 Google 下載(Dump)出成千上萬條原始資料時,我驚呆了。那只有時間與標題,雜亂無章。這時,數據工程核心的 ETL 觀念 就派上用場了。
- Extract (擷取): 從雜亂的來源中把資料抓出來。
- Transform (轉換): 把資料清洗、分類、轉換成人類看得懂的格式。
- Load (載入): 把處理好的結果放進工具裡呈現。
我的目標是「質化」趨勢分析,與其寫程式 Parse 資料、手動上 Tag。我需要一個更聰明的方式來處理這些技術活。
2. AI 數據分析師:NotebookLM 的神救援
我選擇了目前最強大的 AI 筆記工具:NotebookLM。它能「吃掉」海量文件並內化成知識庫。我將原始紀錄(Raw Data)餵給它,不需要寫 SQL,只需用「人話」下達指令:
「請分析我過去一年的觀看紀錄,排除短片、廣告與音樂,並針對主題進行分類。」
沒想到,我的生活被精準拆解為六大領域:科普知識、房產經濟、職場心理、健身解剖、魂系遊戲解析以及 AI 科技趨勢。
3. 二輪 Pipeline 處理:從分類到精準統計
資料處理是場「Pipeline(流水線)」。我進行了第二步:將分類結果重新轉化為來源。在資料庫觀念中,這就像是 Table Join(資料表串接)。
我好奇,為什麼「魂系遊戲」會上榜?於是我下達第二道指令進行統計:
「針對這 6 個主題,從『觀看數量』與『總時數』兩個面向,統計出各自佔比。」
數據揭露了真相:數量代表廣度,時數代表深度。 雖然科普類影片數量第一,滿足了我對世界的好奇;但「魂系遊戲」雖然數量不多,時數卻高居第二。這顯示我對宮崎英高的箱庭地圖設計與高難度挑戰有著極深的沉浸感。
4. 視覺化產出:看見真正的自己
最後,我將分析結果轉為視覺化圖表。當圓餅圖產出的那一刻,我對自己的生活習慣有了全新的認知。透過 ETL 邏輯加上 AI 運算力,我省去了數十小時的建置,只花不到半小時,就完成了一次精準的自我審視。
結論:科技是為了讓我們更了解自己
科技是為了讓我們更了解自己 這場實驗是一次「重塑自我認知」的過程。AI 不只能計算數字,還能從碎片化的數位行為中,映照出那個連你自己都沒察覺到的真實自我。
如果你也好奇時間都花在哪了,不妨下載紀錄,讓 AI 為你做一次數位健檢,說不定你也會有驚人的發現!













