機器學習問題類型（2）：資料特性——時間序列與高維資料是什麼？

ReiY

發佈於自學與知識整理

2026/04/30 更新2026/04/30 發佈閱讀 9 分鐘

其實機器學習的入門知識很多，
為什麼上一篇會先挑「迴歸、分類、聚類」來整理，
一個很現實的原因是因為，
有非常多的 Artificial Intelligence 課程影片，
都會在開頭不久的地方，講到這三個概念。

而且通常還會搭配各種演算法（algorithm）一起解釋，
讓人很容易以為，

「某一種演算法，應該是對應某一種問題類型吧？」

蕾依奈爾一開始也是這樣理解的……
不過，果然事情不是我想的那樣單純。

學著學著，慢慢開始出現一些，
怎麼看都很難塞進原本那個「問題類型」的架構裡的東西，

像是「時間序列」或「降維」。
（這個考題超級無敵愛考😑）

雖然蕾依奈爾平常是個崇尚隨性的人，
但每當看到排列整齊的東西，心中就覺得無比療癒☺️
因此看到一堆資料在眼前亂飄的時候，「對齊癖」就會發作。
「對不上」，
是一件有點痛苦的事情。

正當我在疑惑為什麼放不進去架構裡的時候，
突然意識到一件事：
原來漏掉了一層，關於「資料特性」的整理。

也就是說，
迴歸、分類、聚類在說的，是機器學習的「任務類型」（task types），
但像「時間序列」或「降維」這些概念，
其實都跟「資料特性」（data characteristics）有關。

😯

難怪怎麼塞都塞不進去。
因為它們根本就不應該被放在同一格裡。

所以這一篇，
整理的是跟資料特性有關的這幾個名詞，
以及常常一起出現的相關演算法。

資料特性（data characteristics）

資料特性，其實應該在「任務類型」之前先說明才對，
不過因為蕾依奈爾是先接觸了迴歸、分類跟聚類之後，
才發現有些東西對不上心中的架構分類表，
所以這裡就依照我的學習筆記順序來整理。

任務類型，指的是機器學習模型要做什麼，
而資料特性，則是回頭看一件更基本的事情：

——「我們手上的資料，本身到底長什麼樣子？」

有些資料的差別，不在於要預測什麼答案，
而是在於資料的「結構」本身就不一樣。

例如，有些資料是沿著時間排列的，
前後順序本身就帶有意義。
也有些資料則是同一筆資料裡包含非常多欄位，
特徵多到讓人難以理解或處理。

所以在這一篇，
我想整理兩種常見、也很容易被混在一起的資料特性名詞：

一種是「時間序列」——資料具有順序
一種是「高維資料」——資料特徵很多、結構複雜

接下來，先從最直覺的「時間序列」開始。

時間序列（Time Series）：有時間順序的資料

「時間序列」這個詞，乍看之下好像不難理解。

時間＋序列

所以直覺上就是：「跟時間有關的資料，照順序排在一起。」
應該沒有錯吧？

初步看起來這樣理解是沒有錯，
不過，眉角就在這裡😯

如果只是一般的資料，
像是身高、年齡、收入這種欄位，
就算順序打亂，資料本身的意義也不會改變。

但「時間序列」不一樣。
時間前後的關係，本身就是資訊的一部分，
所以它的順序是不可以被打亂的。

比方說，

全球氣溫的逐漸升高，呈現一種長期的變化趨勢。
夏天的冰淇淋銷售量，是在「夏天」這個時間裡週期性重現。

因此時間的「序列」不能被隨意打亂，
如果把這些資料隨便打亂順序，
就等於把原本隱含在裡面的變化趨勢全部打散了。

也就是說，時間序列的關鍵，不只是「有時間」，
而是「時間的順序本身具有意義」。
（甚至可以說，順序才是重點😑）

這也是為什麼，在處理這類資料時，
不能把它當成一般資料來隨意洗牌或重排。
因為一旦順序被破壞，
很多原本存在的規律，也就跟著消失了。

嗯？？這麼說的話，
《詐欺遊戲》裡面的男主角秋山，在《17張撲克牌》（17 Poker）裡使出的，
追蹤全部撲克牌順序、然後預測牌型的神技，
好像有點類似時間序列的概念囉？😆

哈哈，雖然秋山的神技不完全是時間序列的概念，
但在「順序本身帶有資訊」這一點上，兩者其實是相似的。

也正因為時間序列中的資料彼此之間存在前後的依賴關係，
這類資料常常會被用來做預測。
（就像秋山可以預測《17 Poker》的牌型一樣😆）

一旦資料之間存在時間上的連續性，
就代表裡面可能藏著某種規律或趨勢。
而這些規律，正是後續分析或預測的基礎。

例如，我們會根據過去幾天的氣溫變化，
推測接下來的天氣趨勢。
或是觀察一段時間內的數據變動，
來預估未來可能的走向。

高維資料（high-dimensional data）：有大量特徵的資料

根據蕾依奈爾寫過的考題來看，
「時間序列」通常不會直接考你定義，
而是會用比較應用的方式出題。
例如問：「哪一種模型適合用來預測與時間有關的趨勢？」
（看到「時間」，第一直覺就會想到 RNN😆）

相較之下，「高維資料」則常常會搭配另一個關鍵字一起出現：
——主成分分析（PCA），
也就是一種常用來進行「降維」（Dimensionality Reduction）的方法。

那為什麼會需要「降維」呢？
先從這個問題反過來想：

既然要「降維」，
就代表原本的資料「維度太高了」。

也就是說，「降維」這個行為，
其實是為了處理「高維資料」而出現的。

所以在談降維之前，
我們應該先回頭看一件事：

什麼是「高維資料」？

所謂的「高維資料」，
指的是一筆資料中包含了大量的特徵（features）。

資料當中如果只含有幾個特徵的欄位，例如身高、年齡、收入，
這種資料通常還算直觀，
通常也比較容易理解它們之間的關係。

但當欄位數量開始變多的時候，事情就不太一樣了。

一筆資料可能同時包含幾十個、甚至上百個特徵。
然後每個特徵之間，可能還會互相影響。

這種情況下，資料雖然看起來很「完整」，
但也會變得越來越難理解、越來越難處理。

例如，一個人的資料可能同時包含：

年齡
收入
教育程度
消費習慣
興趣偏好
社交行為
……

當這些資訊全部放在一起時，
很難用直觀的方式去判斷，
到底哪些特徵才是真正重要的。

每一個特徵，就是資料的一個維度，
當資料中的特徵越多時，對應的維度也會越高。

維度越高，資訊不一定越清楚，
反而可能變得更混亂😑
（甚至有一種「資料很多，但看不懂」的感覺）
這也是高維資料最麻煩的地方。

所以在這種情況下，
通常不會直接處理這些複雜的資料，而是會嘗試做一件事：

——「降維」，
也就是把資料變簡單。

在各種降維的方法中，最常見的一種，
就是「主成分分析」（Principal Component Analysis, PCA）。

我一開始看到這個「主成分分析」的時候，第一個想法是：

主成分？
這東西可以吃嗎？
是什麼食物還是營養素的名字嗎？😆

但是原來不是。

降維（Dimensionality Reduction）與主成分分析（Principal Component Analysis, PCA）

主成分分析，是指把原本細節跟資訊很多的資料，
用類似投影或壓縮的方式，
轉換成幾個最有代表性的方向，
變成「儘管只剩下比較簡化的輪廓，但你還是認得出他是誰」的「主成分」，
再用這個比較簡化的版本來進行分析。
可以省時、又省腦力。

😯

這方法好像有點聰明😆

在我心中突然想到，
這好像有點像3D遊戲要動畫化的時候，
原本立體的人物角色，變成扁扁的 2D 形象。

雖然資訊變少了，但你還是認得出來這個人是誰。

而且細節也變少了，
畫起來也許更省力了😆
然後一點也不影響這個IP的商業化擴散😏

邪惡的聰明啊～
感覺每個上班族都應該學會這招，
適時進行一點「降維運作」😏

原來問題在這裡

如果用一句話來整理這一篇的重點：

迴歸、分類、聚類，是在回答「要做什麼任務」
時間序列、高維資料，則是在描述「資料本身長什麼樣」

當我把「任務」跟「資料」這兩個層次分開之後，
很多原本看起來混亂的概念，就變得清楚多了。

至少現在再看到「時間序列」或「降維」的時候，
比較不會下意識想把它們塞回原本那個分類表裡了😆

整理到這裡，其實會發現一件事：
目前只整理了「任務」跟「資料」這兩個層次，

但在機器學習裡，
其實還有另外兩個很容易被混在一起的概念：

模型（Model）
演算法（Algorithm）

這兩個東西在很多教材或課程中，
常常會被交錯使用。
一開始其實很難分清楚差別，
所以先簡單畫一張目前整理出來的「結構地圖」：

至於模型跟演算法之間到底差在哪，
如果有機會再繼續來整理😊

➡️延伸閱讀：

線性迴歸到底是在迴歸什麼？原來聚類跟分類不一樣！（機器學習入門）

留言

ReiY的沙龍

2會員

10內容數

什麼都寫一點。有時候是學習，有時候只是生活，也可能只是某一天突然想明白了一件事。

ReiY的沙龍的其他內容

2026/04/23

線性迴歸到底是在迴歸什麼？原來聚類跟分類不一樣！（機器學習入門）

在學 AI 或機器學習時，「迴歸、分類、聚類」看起來好像差不多，但其實完全不是同一件事。這篇整理我在準備 iPAS 時最卡的一段，用最直白的方式拆解：迴歸是在猜數值，分類是在選答案，聚類則是連答案都沒有，要自己分出來。如果你也有「每個字都懂但整句看不懂」的感覺，這篇會幫你釐清。

2026/04/23

線性迴歸到底是在迴歸什麼？原來聚類跟分類不一樣！（機器學習入門）

2026/04/16

用視覺小說遊戲（Visual Novel）理解機器學習的三種學習方式

玩視覺小說遊戲的時候，你會不看攻略亂選，還是直接查好結局一路精準過關？或者，在一次次Bad End之後，慢慢學會怎麼選才不會出事？在自學機器學習時，我發現這些遊戲中的進行方式，其實正對應到三種不同的學習模式。原來我們早就在用機器學習了，只是從來沒有這樣叫它而已。

2026/04/16

用視覺小說遊戲（Visual Novel）理解機器學習的三種學習方式

2026/04/15

Artificial Intelligence 自學筆記（2）——Deep Learning是什麼？從機器學習到深度學習

從機器學習）的限制出發，介紹深度學習如何透過多層神經網路，讓機器能夠自行從資料中學習特徵，而不再依賴人工定義；介紹深度學習的運作概念、AI「黑箱模型」的特性、 CNN、RNN、Transformer 等常見模型與應用。——AI，其實早已存在於我們的生活之中。

2026/04/15

Artificial Intelligence 自學筆記（2）——Deep Learning是什麼？從機器學習到深度學習

看更多

你可能也想看

WHITE LAB｜白話實驗室的沙龍

【茶水間 AI 實戰】第五卷：內功心法 AI 是怎麼學會思考的？深度學習 × 強化學習 × 自監督學習解析

AI 剛出生只是一張白紙，它是怎麼變聰明的？本集帶你潛入 Brainstorm 的 AI 培訓中心，透過生動的職場情境劇，白話解碼 8 種 AI 必修「學習範式」！從深度學習、強化學習到自監督與提示學習，輕鬆搞懂模型背後的訓練邏輯與老闆的省錢妙招。文末還有實戰測驗，快來挑戰！

#白話實驗室#AI學習範式#深度學習

2026/03/12

WHITE LAB｜白話實驗室的沙龍

【茶水間 AI 實戰】第五卷：內功心法 AI 是怎麼學會思考的？深度學習 × 強化學習 × 自監督學習解析

#白話實驗室#AI學習範式#深度學習

2026/03/12

Amily的沙龍

北藝嚴選指南：從兒童藝術節到國際共製，聰明玩家的 75 折選戲術

當時間變少之後，看戲反而變得更加重要——這是在成為母親之後，我第一次誠實地面對這一件事：我沒有那麼多的晚上，可以任性地留給自己了。看戲不再只是「今天有沒有空」，而是牽動整個週末的結構，誰應該照顧孩子，我該在什麼時間回到家，隔天還有沒有精神帶小孩⋯⋯於是，我不得不學會一件以前並不擅長的事：挑選。

#北藝嚴選指南#兒童藝術節#臺北表演藝術中心

2026/04/20

Amily的沙龍

北藝嚴選指南：從兒童藝術節到國際共製，聰明玩家的 75 折選戲術

#北藝嚴選指南#兒童藝術節#臺北表演藝術中心

2026/04/20

WHITE LAB｜白話實驗室的沙龍

【神機營 AI 實戰】第五篇：機關異術的內功修煉室——深度學習、強化學習與自監督修煉心法

神機營的新機關木人剛出爐時，其實只是毫無靈氣的頑木。要讓它們學會辨識與決策，關鍵在於「修煉心法」。本篇帶你走進神機營的內功修煉室，用武俠比喻拆解 AI 的學習方式：從深度學習的海量灌頂，到半監督與自監督的省力傳功，再到強化學習與對比學習的特訓之道，最後揭開元學習與 Prompt 引導的速成心法。

#AI學習方式#深度學習#強化學習

2026/03/19

WHITE LAB｜白話實驗室的沙龍

【神機營 AI 實戰】第五篇：機關異術的內功修煉室——深度學習、強化學習與自監督修煉心法

#AI學習方式#深度學習#強化學習

2026/03/19

書子的 AI 應用筆記

B 航線｜迴歸的其他選擇：「何時該換模型」

不是所有「預測數值」的問題，都適合線性迴歸什麼時候「線性迴歸開始不夠用」？ 1. 關係明顯不是直線(非線性) 2. 不同狀況，行為模式完全不同(時間關係) 3. 因素之間有交互影響(交互作用) 4. 資料分布非常不平均(資料結構)

#iPASAI應用規劃師#AI900#機器學習

2026/02/04

書子的 AI 應用筆記

B 航線｜迴歸的其他選擇：「何時該換模型」

#iPASAI應用規劃師#AI900#機器學習

2026/02/04

方格子 vocus 官方沙龍

🏝️ 方格創作島｜【創作地圖組】全攻略：解鎖靈感，再抽精美家電 ദ്ദി(•̀ ᗜ <)

5 月，方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間，每週都會有新的任務地圖與陪跑計畫，從最簡單的帳號使用、沙龍建立，到帶著你從一句話、一張照片開始，一步一步找到屬於自己的創作節奏。不需要長篇大論，不需要完美的文筆，只需要帶上你今天的日常，就可以出發。征服創作島，抱回靈感與大獎！

#創作#vocus#方格創作島

2026/04/23

方格子 vocus 官方沙龍

🏝️ 方格創作島｜【創作地圖組】全攻略：解鎖靈感，再抽精美家電 ദ്ദി(•̀ ᗜ <)

#創作#vocus#方格創作島

2026/04/23

Ethan的AI學習筆記

《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?

在現實生活中，許多資料並非靜止的，它們會隨著時間不斷變化，形成了一種特殊的資料型態，這就是時間序列資料。時間序列數據廣泛存在於各種領域，如金融市場的股票價格波動、氣候監測的溫度變化、製造業的機器故障檢測，以及網站流量的每日訪問量等。這些資料的最大特點在於：當前的觀測值與過去的值密切相關，未來的趨勢也

#人工智慧#迴歸分析#機器學習

2025/10/11

Ethan的AI學習筆記

《從零開始的資料科學筆記》Day#18: 資料具有時間特性怎麼訓練?

#人工智慧#迴歸分析#機器學習

2025/10/11

AI 峰哥

AI教母李飛飛與World Labs：重新定義3D空間與AI的未來

這篇文章探討了World Labs這家新興人工智能公司，以及其創辦人李飛飛如何帶領團隊突破3D世界生成技術的界限。文章詳細介紹了AI在創意產業中的應用潛力，如何通過3D生成技術提升設計與製作效率。此外，也討論了大世界模型的未來發展和AI在商業世界中的重要性，並提供增加企業AI能力的建議。

#AI#阿峰老師#人工智慧

2024/12/12

AI 峰哥

AI教母李飛飛與World Labs：重新定義3D空間與AI的未來

#AI#阿峰老師#人工智慧

2024/12/12

書子的 AI 應用筆記

B 航線：沒有標準答案時，AI 在學什麼？——非監督式學習的原理與用途

非監督式學習（Unsupervised Learning）用來處理沒有答案的資料。它不依賴事先標記好的答案，而是透過觀察資料本身，找出相似性、隱藏關係與整體結構，幫助我們理解資料「長什麼樣子」。因此，非監督式學習常被用在資料探索、前處理與策略分析。當問題尚未被清楚定義時，它往往是第一個登場的工具。

#iPASAI應用規劃師#AI900#人工智慧

2026/02/06

書子的 AI 應用筆記

B 航線：沒有標準答案時，AI 在學什麼？——非監督式學習的原理與用途

#iPASAI應用規劃師#AI900#人工智慧

2026/02/06

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：流動、跨域、變形的「生存之道」

當代名導基里爾．賽勒布倫尼科夫身兼電影、劇場與歌劇導演，其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後，他持續以創作回應專制體制的壓迫。《傳奇：帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析，解構賽勒布倫尼科夫如何利用影劇雙棲的特質，在荒謬世道中尋找藝術的「生存之道」。

#釀電影#釀評論#藝術評論

2026/02/28