21/100 線性回歸 📈 最基本的機器學習模型，適合預測連續數據（如房價）！

Signal Architect｜艾韓思

發佈於🤖 機器學習《資料會思考嗎？｜讓機器學會判斷的第一現場》

2026/04/08 更新2025/05/27 發佈閱讀 8 分鐘

AI時代系列(1) 機器學習三部曲: 🔹 第一部：《機器學習 —— AI 智慧的啟航》

21/100 第三週：監督學習（回歸）

21.線性回歸 📈 最基本的機器學習模型，適合預測連續數據（如房價）！

監督學習（回歸）的第一部分，將介紹線性回歸（Linear Regression），它是機器學習中最基本且重要的模型之一。適合用來預測連續數據，如房價、收入、溫度、銷售額等。

________________________________________

📌 線性回歸（Linear Regression）

線性回歸是最簡單的機器學習模型，它假設輸入特徵與輸出之間存在線性關係，並使用一條直線來擬合數據。

________________________________________

1️⃣ 線性回歸的基本概念

🎯 目標

找出一條最佳直線來預測連續變數 y，滿足：

y=wX+b

其中：

• y 是目標值（預測值）

• X 是輸入特徵

• w 是權重（斜率）

• b 是截距（bias）

示例：預測房價假設 X=房屋面積（平方公尺），y=房價（萬元）：

房價=5000×面積+10

這表示：

• 每增加 1 平方公尺，房價增加 5000 萬元

• 當面積為 0，房價為 10 萬元（截距）

________________________________________

2️⃣ 如何尋找最佳直線？

使用最小二乘法（Least Squares Method）來找到最佳的 w 和 b，讓預測值 y^與實際值之間的誤差最小。

誤差衡量方式：均方誤差（MSE）

均方誤差的文字描述可以這樣表達：「先計算每筆資料的『預測值減實際值』之差，再將這些差值平方後求平均，就是均方誤差。」

目標：調整 w,b 讓 MSE 最小化。

方法：

• 解析解（Closed-form Solution）：直接計算最優解（適用於小數據）

• 梯度下降（Gradient Descent）：反覆調整 w,b（適用於大數據）

________________________________________

3️⃣ Python 實作：簡單線性回歸

我們使用 sklearn 來建立線性回歸模型，並用它來預測房價。

✅ (1) 生成數據

python

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

# 產生隨機房屋面積數據（平方公尺）

np.random.seed(42)

X = np.random.randint(20, 200, size=(50, 1)) # 房屋面積

y = 5000 * X + 10000 + np.random.randint(-50000, 50000, size=(50, 1)) # 房價（加入隨機噪聲）

# 繪製數據點

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.xlabel("房屋面積（平方公尺）")

plt.ylabel("房價（萬元）")

plt.title("房價 vs. 房屋面積")

plt.legend()

plt.show()

________________________________________

✅ (2) 訓練線性回歸模型

python

# 創建線性回歸模型

model = LinearRegression()

# 訓練模型

model.fit(X, y)

# 獲取最佳參數

w = model.coef_[0][0] # 斜率

b = model.intercept_[0] # 截距

print(f"線性回歸方程：房價 = {w:.2f} * 面積 + {b:.2f}")

________________________________________

✅ (3) 預測與視覺化

python

# 預測房價

y_pred = model.predict(X)

# 繪製回歸線

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, y_pred, color='red', linewidth=2, label="預測直線")

plt.xlabel("房屋面積（平方公尺）")

plt.ylabel("房價（萬元）")

plt.title("線性回歸模型")

plt.legend()

plt.show()

📌 結果：一條紅色直線擬合數據，代表模型的預測結果。

________________________________________

4️⃣ 模型評估

為了評估線性回歸的表現，我們使用 R² 決定係數（R-squared）和均方誤差（MSE）。

python

from sklearn.metrics import mean_squared_error, r2_score

# 計算 MSE

mse = mean_squared_error(y, y_pred)

# 計算 R² 分數

r2 = r2_score(y, y_pred)

print(f"MSE（均方誤差）：{mse:.2f}")

print(f"R² 決定係數：{r2:.4f}")

📌 R²（決定係數）

• 範圍：0 ~ 1

• 越接近 1，模型擬合效果越好

• 若 R² 很低，可能需要增加特徵或考慮非線性模型

________________________________________

線性回歸的優缺點

🎯 優點

✅ 簡單易懂，計算效率高

✅ 結果具有可解釋性（每個特徵的影響力明確）

✅ 適用於數據線性關係明顯的問題

⚠ 缺點

❌ 無法處理非線性關係（如房價 vs. 需求變化）

❌ 容易受異常值影響（Outliers）

❌ 假設數據無共線性（多個變數不應該高度相關）

________________________________________

📌 結論

✅ 線性回歸是機器學習中最基本的回歸模型

✅ 適用於預測「連續數據」，如房價、銷售額、溫度

✅ 可擴展為多元線性回歸來處理多個變數

✅ 若數據呈非線性關係，需考慮多項式回歸或決策樹回歸

🚀 下一步：深入探索多元回歸模型！ 🎯

含 AI 應用內容

艾韓思 AIHANS｜AI 應用工程筆記🤖 機器學習《資料會思考嗎？｜讓機器學會判斷的第一現場》

留言

艾韓思 AIHANS｜AI 應用工程筆記

46會員

78內容數

AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台，主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例，更強調理性思維與行動力的結合。無論你是AI初學者、創業者，還是追求人生升維的行者，都能在這裡找到前進的方向與志同道合的夥伴。

艾韓思 AIHANS｜AI 應用工程筆記的其他內容

2025/05/26

20/100 小結與測驗-使用 Pandas & NumPy 進行資料處理 🐼 數據處理的強力工具，學會它們效率大增！

掌握 Pandas、NumPy，一站精通數據清理、缺失值補齊、特徵選擇與 PCA 降維！模組化範例搭配自測題，快速鞏固概念並排除常見坑，助你打造更穩定、公平且高效的 AI 模型。入門到實戰必讀，快速開啟數據科學核心能力！

2025/05/26

20/100 小結與測驗-使用 Pandas & NumPy 進行資料處理 🐼 數據處理的強力工具，學會它們效率大增！

2025/05/26

19/100 類別不平衡問題的解決方案 🚦 用權重調整或數據合成技術（SMOTE），讓預測更公平！

面對類別不平衡，別再只看準確率！本單元以詐欺檢測為例，手把手示範過／欠採樣、SMOTE 與 class_weight，並教你用 Recall、F1、AUC 全面評估，讓模型真正兼顧公平與效能。理論＋程式碼雙線並進，入門實戰必看！

2025/05/26

19/100 類別不平衡問題的解決方案 🚦 用權重調整或數據合成技術（SMOTE），讓預測更公平！

2025/05/26

18/100 處理不平衡資料 ⚖ 避免 AI 偏心，讓少數類別也能被正確預測！

失衡的詐欺、醫療資料若不修正，模型易忽視少數類別。本單元教你 RandomOversampling、SMOTE、欠採樣及 class_weight，並用 Precision、Recall、F1、AUC 評估，附 sklearn 範例，快速提升召回率，打造公平 AI，必讀！

2025/05/26

18/100 處理不平衡資料 ⚖ 避免 AI 偏心，讓少數類別也能被正確預測！

看更多

你可能也想看

Will 進步本

拐點 #003: GPT 的名稱怎麼來的

在機器學習領域中，監督學習、無監督學習和強化學習是三種核心方法，它們在解決不同類型的問題時發揮著重要作用。

2024/05/12

Will 進步本

拐點 #003: GPT 的名稱怎麼來的

在機器學習領域中，監督學習、無監督學習和強化學習是三種核心方法，它們在解決不同類型的問題時發揮著重要作用。

2024/05/12

每日發車

筆記-曲博談AI模型.群聯-24.05.05

筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型三個步驟: 1.預訓練，訓練一次要用幾萬顆處理器、訓練時間要1個月，ChatGPT訓練一次的成本為1000萬美金。 2.微調(

2024/05/06

每日發車

筆記-曲博談AI模型.群聯-24.05.05

2024/05/06

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

背景：從冷門配角到市場主線，算力與電力被重新定價小P從2008進入股市，每一個時期的投資亮點都不同，記得2009蘋果手機剛上市，當時蘋果只要在媒體上提到哪一間供應鏈，隔天股價就有驚人的表現，當時光學鏡頭非常熱門，因為手機第一次搭上鏡頭可以拍照，也造就傳統相機廠的殞落，如今手機已經全面普及，題

#AI#算力#電力

2026/04/11

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

#AI#算力#電力

2026/04/11

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

阿Han的沙龍

【🔒 江湖一點訣】年中復盤 - AI 潮流下的學習模式轉變與升級

序幕又來到一年一度的年中的時刻了，不免得要來復盤一下今年的軟體學習與開發上面有了哪些的進步與轉變，很有意思的是今年加入了AI的元素，其實早在去年我們就分享了一篇「【🔒 江湖一點訣】關於寫作，你不需要很厲害才開始，但你從現在開始就可以很厲害」，裡面包含了我們長期累積的心得之外，早就已經

#軟體#軟體工程師#NotebookLM

2024/07/07

阿Han的沙龍

【🔒 江湖一點訣】年中復盤 - AI 潮流下的學習模式轉變與升級

#軟體#軟體工程師#NotebookLM

2024/07/07

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

#ChatGPT#AlphaGo#人工智慧

2024/07/19

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11