24/100 多項式回歸 🏛 當線性回歸不夠用時,讓 AI 用曲線來擬合資料!

AI時代系列(1) 機器學習三部曲: 🔹 第一部:《機器學習 —— AI 智慧的啟航》

24/100 第三週:監督學習(回歸)

24. 多項式回歸 🏛 當線性回歸不夠用時,讓 AI 用曲線來擬合資料!

🏛 多項式回歸(Polynomial Regression)

當線性回歸不夠用時,讓 AI 用曲線來擬合資料!

________________________________________

📌 1️⃣ 為什麼需要多項式回歸?

線性回歸只能擬合直線,但現實數據通常是非線性的!

例如:

房價變化:隨著時間或市場需求,房價可能呈曲線增長 📈

疾病進展:某些疾病的惡化速度隨時間呈指數或拋物線型變化 🏥

車速與煞車距離:當車速增快時,煞車距離呈現二次曲線 🚗💨

這時候,我們可以使用 多項式回歸(Polynomial Regression) 來擬合 非線性數據!

它其實是 線性回歸的一種擴展,但它增加了 高次項特徵,讓回歸線變成曲線。

________________________________________

📌 2️⃣ 多項式回歸的數學公式

多項式回歸方程(以二次為例):

y=w1X+w2X平方+by

這樣,回歸線就變成了一條 拋物線 📈!

當我們增加 更高次項(n次方) 時,模型可以擬合更複雜的非線性關係。

________________________________________

📌 3️⃣ Python 實作:多項式回歸

🎯 例子:房價隨著房屋面積的非線性變化

我們用 線性回歸 vs. 多項式回歸 來對比它們的擬合效果。

________________________________________

✅ (1) 產生數據

python

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

from sklearn.linear_model import LinearRegression

from sklearn.preprocessing import PolynomialFeatures

from sklearn.metrics import mean_squared_error, r2_score


# 產生非線性數據(房價 vs. 房屋面積)

np.random.seed(42)

X = np.random.randint(20, 200, size=(50, 1)) # 房屋面積

y = 3000 * X**2 - 5000 * X + 100000 + np.random.randint(-500000, 500000, size=(50, 1)) # 非線性房價


# 繪製散點圖

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("房價 vs. 房屋面積")

plt.legend()

plt.show()

📌 房價 vs. 房屋面積的數據呈現「非線性曲線關係」。

________________________________________

✅ (2) 使用線性回歸擬合

python

# 創建線性回歸模型

lin_reg = LinearRegression()

lin_reg.fit(X, y)

# 預測

y_pred_lin = lin_reg.predict(X)

# 繪製圖形

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, y_pred_lin, color='red', linewidth=2, label="線性回歸擬合")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("線性回歸擬合效果")

plt.legend()

plt.show()

📌 結果: 線性回歸無法準確擬合數據,因為數據是非線性的!

________________________________________

✅ (3) 使用二次多項式回歸擬合

python

# 創建二次多項式特徵

poly = PolynomialFeatures(degree=2) # 2 次方

X_poly = poly.fit_transform(X)

# 創建並訓練模型

poly_reg = LinearRegression()

poly_reg.fit(X_poly, y)

# 預測

y_pred_poly = poly_reg.predict(X_poly)

# 繪製圖形

plt.scatter(X, y, color='blue', alpha=0.5, label="真實數據")

plt.plot(X, y_pred_poly, color='green', linewidth=2, label="二次多項式回歸擬合")

plt.xlabel("房屋面積(平方公尺)")

plt.ylabel("房價(萬元)")

plt.title("二次多項式回歸擬合效果")

plt.legend()

plt.show()

📌 結果: 多項式回歸能準確擬合數據,擬合的曲線明顯更符合原始數據!

________________________________________

✅ (4) 模型評估

我們比較 線性回歸 vs. 多項式回歸 的 均方誤差(MSE) 和 決定係數(R²):

python

# 計算 MSE 和 R²

mse_lin = mean_squared_error(y, y_pred_lin)

r2_lin = r2_score(y, y_pred_lin)

mse_poly = mean_squared_error(y, y_pred_poly)

r2_poly = r2_score(y, y_pred_poly)

print(f"線性回歸 - MSE: {mse_lin:.2f}, R²: {r2_lin:.4f}")

print(f"二次多項式回歸 - MSE: {mse_poly:.2f}, R²: {r2_poly:.4f}")

📌 結果示例:

線性回歸 - MSE: 3.2e+10, R²: 0.45

二次多項式回歸 - MSE: 1.5e+9, R²: 0.92

📌 解讀:

MSE(均方誤差)越小越好 → 多項式回歸誤差比線性回歸小很多

R²(決定係數)越接近 1 越好 → 多項式回歸的 R² 遠高於線性回歸

________________________________________

📌 4️⃣ 何時使用多項式回歸?

多項式回歸適用於數據呈現非線性關係的情境,當散點圖中的數據點顯示出彎曲的趨勢時,利用多項式回歸可以更精準地擬合這種曲線型態。此外,當數據量較小、無法有效運用成本較高的深度學習技術時,多項式回歸是一種簡單又強大的替代方案,能有效捕捉數據中的複雜關係。同時,多項式回歸透過特徵轉換,將原始特徵擴展到更高維度,使模型能學習到更多樣的模式與變化,進一步提升預測能力。

________________________________________

📌 5️⃣ 選擇適當的多項式次數(Degree)

如果次數太高(如 10 次),模型可能會過擬合(Overfitting),學習到噪音而非真正的模式。

📌 建議

Degree = 2~3:通常可以解決大多數非線性問題

Degree > 5:可能會過擬合,需要謹慎使用

使用交叉驗證(Cross-Validation) 找到最佳次數

________________________________________

🎯 結論

✅ 線性回歸無法擬合非線性數據,多項式回歸能解決這個問題!

✅ 二次或三次多項式回歸通常足夠,不建議使用過高次數!

✅ 多項式回歸適合小型數據集,在大數據上可能不如神經網絡有效!

🚀 下一步:探索「決策樹回歸」來處理更複雜的數據! 🌲


留言
avatar-img
艾韓思 AIHANS|AI 應用工程筆記
46會員
78內容數
AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台,主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例,更強調理性思維與行動力的結合。無論你是AI初學者、創業者,還是追求人生升維的行者,都能在這裡找到前進的方向與志同道合的夥伴。
2025/05/27
正則化回歸在損失函數中加入懲罰項,抑制權重過大,避免模型記憶訓練噪聲而過擬合。Ridge (L2) 收縮所有係數;Lasso (L1) 可將部分係數壓成 0,兼具特徵選擇;ElasticNet 結合 L1 與 L2,兼顧去除冗餘與穩定性,特別適合高維且具共線性的資料。
Thumbnail
2025/05/27
正則化回歸在損失函數中加入懲罰項,抑制權重過大,避免模型記憶訓練噪聲而過擬合。Ridge (L2) 收縮所有係數;Lasso (L1) 可將部分係數壓成 0,兼具特徵選擇;ElasticNet 結合 L1 與 L2,兼顧去除冗餘與穩定性,特別適合高維且具共線性的資料。
Thumbnail
2025/05/27
多元線性回歸單元,教你一次掌握多維特徵建模、共線性診斷與 Python 實戰,讓房價、銷售額等預測更精準,打下進階回歸與正則化基礎。透過真實數據實驗,從特徵選擇、模型訓練到評估指標,一站式建立多變量思維,快速提升商業分析與決策能力。
Thumbnail
2025/05/27
多元線性回歸單元,教你一次掌握多維特徵建模、共線性診斷與 Python 實戰,讓房價、銷售額等預測更精準,打下進階回歸與正則化基礎。透過真實數據實驗,從特徵選擇、模型訓練到評估指標,一站式建立多變量思維,快速提升商業分析與決策能力。
Thumbnail
2025/05/27
想快速掌握機器學習核心?本單元以房價案例手把手示範線性回歸,從理論、Python 實作到評估指標,一條直線即可洞悉數據趨勢,建立建模信心,是所有 AI 新人不可錯過的啟蒙課!更結合 MSE、R² 等評估技巧,助你打下回歸分析扎實基礎,邁向進階多元模型。
Thumbnail
2025/05/27
想快速掌握機器學習核心?本單元以房價案例手把手示範線性回歸,從理論、Python 實作到評估指標,一條直線即可洞悉數據趨勢,建立建模信心,是所有 AI 新人不可錯過的啟蒙課!更結合 MSE、R² 等評估技巧,助你打下回歸分析扎實基礎,邁向進階多元模型。
Thumbnail
看更多
你可能也想看
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
以下都是轉貼各方觀點,重點可以進一步看發表者跟回應者,我自己也有自身應用場景的murmur : 低利率環境可能回不去 科技掌握在大資金公司時代則是持續下去 工業時代引導一波人才需求 東方社會喜歡考試定生死 學校教育外還有補習班可以協助 既然AI工具隨處可得 培養厚植的各方素養與多元興趣
Thumbnail
以下都是轉貼各方觀點,重點可以進一步看發表者跟回應者,我自己也有自身應用場景的murmur : 低利率環境可能回不去 科技掌握在大資金公司時代則是持續下去 工業時代引導一波人才需求 東方社會喜歡考試定生死 學校教育外還有補習班可以協助 既然AI工具隨處可得 培養厚植的各方素養與多元興趣
Thumbnail
序幕 又來到一年一度的年中的時刻了, 不免得要來復盤一下今年的軟體學習與開發上面有了哪些的進步與轉變, 很有意思的是今年加入了AI的元素, 其實早在去年我們就分享了一篇「【🔒 江湖一點訣】關於寫作,你不需要很厲害才開始,但你從現在開始就可以很厲害」, 裡面包含了我們長期累積的心得之外, 早就已經
Thumbnail
序幕 又來到一年一度的年中的時刻了, 不免得要來復盤一下今年的軟體學習與開發上面有了哪些的進步與轉變, 很有意思的是今年加入了AI的元素, 其實早在去年我們就分享了一篇「【🔒 江湖一點訣】關於寫作,你不需要很厲害才開始,但你從現在開始就可以很厲害」, 裡面包含了我們長期累積的心得之外, 早就已經
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
AI與人類分工:預測與判斷的智慧結合
Thumbnail
AI與人類分工:預測與判斷的智慧結合
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News