21/100 線性回歸 📈 最基本的機器學習模型,適合預測連續數據(如房價)!

AI時代系列(1) 機器學習三部曲: 🔹 第一部:《機器學習 —— AI 智慧的啟航》

21/100 第三週:監督學習(回歸)

21.線性回歸 📈 最基本的機器學習模型,適合預測連續數據(如房價)!

監督學習(回歸) 的第一部分,將介紹 線性回歸(Linear Regression),它是機器學習中最基本且重要的模型之一。適合用來預測連續數據,如 房價、收入、溫度、銷售額 等。

________________________________________

📌 線性回歸(Linear Regression)

線性回歸 是 最簡單的機器學習模型,它假設輸入特徵與輸出之間存在線性關係,並使用一條直線來擬合數據。

________________________________________

1️⃣ 線性回歸的基本概念

🎯 目標

找出一條最佳直線來預測連續變數 y,滿足:

y=wX+b

其中:

y 是 目標值(預測值)

X 是 輸入特徵

w 是 權重(斜率)

b 是 截距(bias)

示例:預測房價 假設 X=房屋面積(平方公尺),y=房價(萬元):

房價=5000×面積+10

這表示:

每增加 1 平方公尺,房價增加 5000 萬元

當面積為 0,房價為 10 萬元(截距)

________________________________________

2️⃣ 如何尋找最佳直線?

使用最小二乘法(Least Squares Method) 來找到最佳的 w 和 b,讓預測值 y^與實際值 之間的誤差最小。

誤差衡量方式:均方誤差(MSE)

均方誤差的文字描述可以這樣表達: 「先計算每筆資料的『預測值減實際值』之差,再將這些差值平方後求平均,就是均方誤差。」

目標:調整 w,b 讓 MSE 最小化。

方法:

解析解(Closed-form Solution):直接計算最優解(適用於小數據)

梯度下降(Gradient Descent):反覆調整 w,b(適用於大數據)

________________________________________

3️⃣ Python 實作:簡單線性回歸

我們使用 sklearn 來建立 線性回歸模型,並用它來預測房價。

✅ (1) 生成數據

python

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

# 產生隨機房屋面積數據(平方公尺)

np.random.seed(42)

X = np.random.randint(20, 200, size=(50, 1)) # 房屋面積

y = 5000 * X + 10000 + np.random.randint(-50000, 50000, size=(50, 1)) # 房價(加入隨機噪聲)

# 繪製數據點

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("房價 vs. 房屋面積")

plt.legend()

plt.show()

________________________________________

✅ (2) 訓練線性回歸模型

python

# 創建線性回歸模型

model = LinearRegression()

# 訓練模型

model.fit(X, y)

# 獲取最佳參數

w = model.coef_[0][0] # 斜率

b = model.intercept_[0] # 截距

print(f"線性回歸方程:房價 = {w:.2f} * 面積 + {b:.2f}")

________________________________________

✅ (3) 預測與視覺化

python

# 預測房價

y_pred = model.predict(X)

# 繪製回歸線

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, y_pred, color='red', linewidth=2, label="預測直線")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("線性回歸模型")

plt.legend()

plt.show()

📌 結果: 一條紅色直線擬合數據,代表模型的預測結果。

________________________________________

4️⃣ 模型評估

為了評估線性回歸的表現,我們使用 R² 決定係數(R-squared) 和 均方誤差(MSE)。

python

from sklearn.metrics import mean_squared_error, r2_score

# 計算 MSE

mse = mean_squared_error(y, y_pred)

# 計算 R² 分數

r2 = r2_score(y, y_pred)

print(f"MSE(均方誤差):{mse:.2f}")

print(f"R² 決定係數:{r2:.4f}")

📌 R²(決定係數)

範圍:0 ~ 1

越接近 1,模型擬合效果越好

若 R² 很低,可能需要增加特徵或考慮非線性模型

________________________________________

線性回歸的優缺點

🎯 優點

✅ 簡單易懂,計算效率高

✅ 結果具有可解釋性(每個特徵的影響力明確)

✅ 適用於數據線性關係明顯的問題

⚠ 缺點

❌ 無法處理非線性關係(如房價 vs. 需求變化)

❌ 容易受異常值影響(Outliers)

❌ 假設數據無共線性(多個變數不應該高度相關)

________________________________________

📌 結論

✅ 線性回歸是機器學習中最基本的回歸模型

✅ 適用於預測「連續數據」,如 房價、銷售額、溫度

✅ 可擴展為多元線性回歸來處理多個變數

✅ 若數據呈非線性關係,需考慮 多項式回歸或決策樹回歸

🚀 下一步:深入探索多元回歸模型! 🎯


留言
avatar-img
艾韓思 AIHANS|AI 應用工程筆記
46會員
78內容數
AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台,主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例,更強調理性思維與行動力的結合。無論你是AI初學者、創業者,還是追求人生升維的行者,都能在這裡找到前進的方向與志同道合的夥伴。
2025/05/26
掌握 Pandas、NumPy,一站精通數據清理、缺失值補齊、特徵選擇與 PCA 降維!模組化範例搭配自測題,快速鞏固概念並排除常見坑,助你打造更穩定、公平且高效的 AI 模型。入門到實戰必讀,快速開啟數據科學核心能力!
Thumbnail
2025/05/26
掌握 Pandas、NumPy,一站精通數據清理、缺失值補齊、特徵選擇與 PCA 降維!模組化範例搭配自測題,快速鞏固概念並排除常見坑,助你打造更穩定、公平且高效的 AI 模型。入門到實戰必讀,快速開啟數據科學核心能力!
Thumbnail
2025/05/26
面對類別不平衡,別再只看準確率!本單元以詐欺檢測為例,手把手示範過/欠採樣、SMOTE 與 class_weight,並教你用 Recall、F1、AUC 全面評估,讓模型真正兼顧公平與效能。理論+程式碼雙線並進,入門實戰必看!
Thumbnail
2025/05/26
面對類別不平衡,別再只看準確率!本單元以詐欺檢測為例,手把手示範過/欠採樣、SMOTE 與 class_weight,並教你用 Recall、F1、AUC 全面評估,讓模型真正兼顧公平與效能。理論+程式碼雙線並進,入門實戰必看!
Thumbnail
2025/05/26
失衡的詐欺、醫療資料若不修正,模型易忽視少數類別。本單元教你 RandomOversampling、SMOTE、欠採樣及 class_weight,並用 Precision、Recall、F1、AUC 評估,附 sklearn 範例,快速提升召回率,打造公平 AI,必讀!
Thumbnail
2025/05/26
失衡的詐欺、醫療資料若不修正,模型易忽視少數類別。本單元教你 RandomOversampling、SMOTE、欠採樣及 class_weight,並用 Precision、Recall、F1、AUC 評估,附 sklearn 範例,快速提升召回率,打造公平 AI,必讀!
Thumbnail
看更多
你可能也想看
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
序幕 又來到一年一度的年中的時刻了, 不免得要來復盤一下今年的軟體學習與開發上面有了哪些的進步與轉變, 很有意思的是今年加入了AI的元素, 其實早在去年我們就分享了一篇「【🔒 江湖一點訣】關於寫作,你不需要很厲害才開始,但你從現在開始就可以很厲害」, 裡面包含了我們長期累積的心得之外, 早就已經
Thumbnail
序幕 又來到一年一度的年中的時刻了, 不免得要來復盤一下今年的軟體學習與開發上面有了哪些的進步與轉變, 很有意思的是今年加入了AI的元素, 其實早在去年我們就分享了一篇「【🔒 江湖一點訣】關於寫作,你不需要很厲害才開始,但你從現在開始就可以很厲害」, 裡面包含了我們長期累積的心得之外, 早就已經
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
這一節課說明,如何透過改變給模型的指示或咒語(prompt),來得到不同的結果 。如果直接說結論的話會是,在今天語言模型的能力之下,我們只要交代清楚任務就好,可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD
Thumbnail
這一節課說明,如何透過改變給模型的指示或咒語(prompt),來得到不同的結果 。如果直接說結論的話會是,在今天語言模型的能力之下,我們只要交代清楚任務就好,可以包括背景以及需求。而這節課很像是一堂模型咒語的歷史課 XD
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News