機器學習的流程

iPAS AI應用規劃師學習筆記

發佈於AWS AIF-C01

2025/08/08 更新2025/07/16 發佈閱讀 2 分鐘

機器學習的流程大致上可分為以下幾個主要步驟：

定義問題
- 明確了解你的業務目標或要解決的問題，並具體描述成可用機器學習解決的問題，例如分類、預測或分群。
資料收集與建立資料集
- 收集相關數據，通常自多個來源；整理、清洗數據(例如去除異常值、補齊缺失值)。
- 資料需拆分為訓練集、驗證集、測試集（常見比例：80/10/10或80/20），以利模型訓練與測試。
資料前處理與特徵工程
- 包含資料格式轉換、標準化、特徵選擇、創造新特徵等，提高模型對重點資訊的學習能力。
選擇合適的機器學習模型或演算法
- 根據問題類型（如迴歸、分類、分群）及資料特性，決定要用的模型，例如：決策樹、隨機森林、SVM、神經網路等。
訓練模型
- 使用訓練集進行模型訓練，期間不斷嘗試、修正與優化模型參數，讓模型最大程度地學會資料的規律。
評估模型
- 利用預留的驗證集或測試集，依據任務選擇評估指標（如準確率、召回率、F1分數等），檢查模型效能，避免過適（overfitting）。
模型調優（超參數調整）
- 根據評估結果，針對模型的參數、特徵或演算法進行微調，反覆訓練，直到達到最佳效果。
部署與預測
- 將訓練好的模型上線，實際應用到業務流程，讓其在真實環境中預測新數據或自動執行特定任務。
持續監控與維護
- 部署後需持續觀察模型效果，若資料分布發生變化，須重新訓練或調整模型以維持準確性。

不同領域專案可能根據實際需求適當加入或移除某些步驟，但整體邏輯皆大致遵循此順序，並強調每一步驟的數據與追蹤紀錄十分重要，以便日後問責與優化。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記AWS AIF-C01

留言

郝信華 iPAS AI應用規劃師學習筆記

44會員

572內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師初級+中級(數據分析) AWS AIF-C01 AWS CLF-C02 Microsoft AI-900 其他：富邦美術館志工

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/07/16

Nearest Neighbor Search

Nearest Neighbor Search（最鄰近搜尋）概論什麼是 Nearest Neighbor Search？ Nearest Neighbor Search（NNS, 最鄰近搜尋）是一種優化問題，其目的是在已知資料點集合 S 中，尋找與特定查詢點 q 距離最近（或最相似）的資料點。

2025/07/16

Nearest Neighbor Search

2025/07/16

Scalable index management

Scalable Index Management 概述什麼是 Scalable Index Management？在數據密集型應用中，索引管理是確保資料存取高效率與系統性能的關鍵。Scalable Index Management（可擴展索引管理）是指在資料規模擴大時，能夠有效維護、擴展

2025/07/16

Scalable index management

2025/07/15

Prompt Distillation

Prompt Distillation 簡介定義 Prompt Distillation 是人工智慧與提示工程（prompt engineering）中的一項技術，旨在將較長且複雜的提示（prompt）壓縮成更簡短且高效的版本，同時保持其效果不變。這種方法透過萃取與保留原始提示中最關鍵的元素，

2025/07/15

Prompt Distillation

看更多

你可能也想看

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11