遞迴神經網路 (Recurrent Neural Network, RNN)

iPAS AI應用規劃師學習筆記

發佈於自然語言處理與應用

2025/08/08 更新2025/05/24 發佈閱讀 4 分鐘

"遞迴神經網路 (Recurrent Neural Network, RNN)" 是一種特別設計來處理序列數據的神經網路。和傳統的前饋神經網路不同的是，RNN 具有「記憶」能力，能夠利用先前輸入的資訊來影響後續的輸出。

你可以想像一下，當你閱讀一篇文章時，你不會孤立地理解每一個字，而是會根據前面讀過的句子來理解當前的句子。RNN 的設計靈感就來自於此，它們在處理序列數據（例如文本、時間序列資料、語音等）時，能夠記住之前的信息，並將其用於當前的處理。

以下是 RNN 的幾個關鍵概念：

循環連接 (Recurrent Connections): RNN 的主要特點是它內部存在循環連接，這使得資訊可以在網路中不斷地傳遞和保留。這就像在網路中加入了一個「記憶迴路」。
隱藏狀態 (Hidden State): RNN 會維護一個隱藏狀態（或稱為記憶單元），這個狀態會隨著時間的推移而更新，並儲存了過去輸入的相關資訊。
時間步 (Time Steps): 序列數據通常被視為一系列按時間順序排列的輸入，每個輸入都對應一個「時間步」。RNN 會在每個時間步處理一個輸入，並更新其隱藏狀態。

RNN 的運作方式 (簡化版):

輸入: 在每個時間步，RNN 接收一個序列中的一個元素作為輸入。
隱藏狀態更新: RNN 會根據當前的輸入和上一個時間步的隱藏狀態來計算出新的隱藏狀態。這個新的隱藏狀態包含了到目前為止的序列資訊。
輸出 (可選): 在每個時間步，RNN 可以產生一個輸出，這個輸出是基於當前的隱藏狀態計算出來的。

RNN 的應用：

由於其處理序列數據的能力，RNN 被廣泛應用於以下領域：

自然語言處理 (NLP):
- 語言模型 (Language Modeling): 預測序列中下一個詞語。文本分類 (Text Classification): 對文本進行分類，例如情感分析。機器翻譯 (Machine Translation): 將一種語言的文本翻譯成另一種語言。序列標註 (Sequence Labeling): 為序列中的每個元素分配一個標籤，例如詞性標註。
時間序列預測 (Time Series Forecasting): 預測未來一段時間內的數值，例如股票價格預測、天氣預報。
語音辨識 (Speech Recognition): 將語音轉換成文字。
影像描述 (Image Captioning): 為圖片生成文字描述。

RNN 的局限性：

雖然 RNN 非常強大，但也存在一些局限性，例如：

梯度消失/梯度爆炸問題 (Vanishing/Exploding Gradients): 在處理長序列時，網路中的梯度可能會變得非常小或非常大，導致訓練困難。
難以捕捉長距離依賴 (Long-Term Dependencies): 傳統的 RNN 在記憶長序列中的資訊方面存在困難。

為了克服這些局限性，研究人員提出了更複雜的 RNN 變體，例如 長短期記憶網路 (Long Short-Term Memory, LSTM) 和 門控循環單元 (Gated Recurrent Unit, GRU)，它們在處理長序列數據方面表現得更好。

總之，遞迴神經網路 (RNN) 是一種強大的深度學習模型，特別適合處理具有時間或順序關係的數據。儘管存在一些挑戰，但它在許多領域都取得了顯著的成功。

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記自然語言處理與應用序列模型與架構

留言

郝信華 iPAS AI應用規劃師學習筆記

44會員

572內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師初級+中級(數據分析) AWS AIF-C01 AWS CLF-C02 Microsoft AI-900 其他：富邦美術館志工

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/05/24

魯棒性 (lǔbàng xìng)

"魯棒性" (lǔbàng xìng) 指的是一個系統、模型或產品在面對各種異常、錯誤或不確定性的情況下，仍然能夠維持其功能和性能的能力。簡單來說，就是指它夠不夠 "堅強"、"穩定"，不容易被意外情況影響而崩潰或失效。你可以想像一下：一個堅固的杯子：即使不小心掉到地上，也不容易摔碎，這就是

2025/05/24

魯棒性 (lǔbàng xìng)

2025/05/24

泛化能力 (generalization ability)

"泛化能力" (generalization ability) 指的是一個模型或系統在未曾見過的資料上表現良好的能力。簡單來說，就是模型能夠從已知的訓練資料中學習到的規律，並將這些規律應用到新的、未知的資料上。你可以將它想像成一個學生學習解數學題的過程。如果一個學生只是死記硬背課本上的例題，那麼

2025/05/24

泛化能力 (generalization ability)

2025/05/23

聊天機器人 (Chatbot)

聊天機器人 (Chatbot)，也常簡稱為「聊天機器」或「對話式 AI」，是一種電腦程式。它的設計目的是為了模擬人類的對話，透過文字或語音與使用者進行互動。簡單來說，聊天機器人就是一個能夠與人「聊天」的軟體。

2025/05/23

你可能也想看

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。接著來談 Transformer 架構中的 Feedforward Network (FFN)：其為全連接的神經網路架構回顧 AI說書 - 從0開始 - 64

#AI#ai#PositionalEncoding

2024/06/29

Learn AI 不 BI

AI說書 - 從0開始 - 65

#AI#ai#PositionalEncoding

2024/06/29

Karen的沙龍

【邁向圖神經網絡GNN】Part3: 圖神經網絡的核心-訊息傳遞機制

本篇文章專注於消息傳遞（message passing）在圖神經網絡（GNN）中的應用，並以簡單的例子解釋了消息傳遞的過程和機制。

#GNN#Graph#messagepassin

2024/07/24

Karen的沙龍

【邁向圖神經網絡GNN】Part3: 圖神經網絡的核心-訊息傳遞機制

本篇文章專注於消息傳遞（message passing）在圖神經網絡（GNN）中的應用，並以簡單的例子解釋了消息傳遞的過程和機制。

#GNN#Graph#messagepassin

2024/07/24

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

背景：從冷門配角到市場主線，算力與電力被重新定價小P從2008進入股市，每一個時期的投資亮點都不同，記得2009蘋果手機剛上市，當時蘋果只要在媒體上提到哪一間供應鏈，隔天股價就有驚人的表現，當時光學鏡頭非常熱門，因為手機第一次搭上鏡頭可以拍照，也造就傳統相機廠的殞落，如今手機已經全面普及，題

#AI#算力#電力

2026/04/11

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

#AI#算力#電力

2026/04/11

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

柴郡貓姍蒂的沙龍

筆記-深度學習論文閱讀：Deep Residual Learning for Image Recognition

前言在閱讀《強化式學習：打造最強 AlphaZero 通用演算法》時，文中介紹了殘差網路，並推薦了兩篇論文；因為在看了書後，對殘差網路的概念還是不很清楚，於是決定用ChatGPT翻譯這兩篇論文來增強理解，以下正文是第一篇論文：Deep Residual Learning for Image Re

#深度學習#人工智慧#殘差網路

2024/07/07

柴郡貓姍蒂的沙龍

筆記-深度學習論文閱讀：Deep Residual Learning for Image Recognition

#深度學習#人工智慧#殘差網路

2024/07/07

Karen的沙龍

【邁向圖神經網絡GNN】Part5: 建構 GNN model 實作 Cora 資料集結點分類任務

本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡（GNN），並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化，包括引入批量標準化和獨立的消息傳遞層，調整Dropout和聚合函數，顯著提高了模型的分類準確率。實驗結果表明，經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。

#GNN#Graph#dropout

2024/07/28

Karen的沙龍

【邁向圖神經網絡GNN】Part5: 建構 GNN model 實作 Cora 資料集結點分類任務

#GNN#Graph#dropout

2024/07/28

螃蟹_crab的沙龍

[深度學習]LSTM模型

長短期記憶（英語：Long Short-Term Memory，LSTM）是一種時間循環神經網路（RNN），論文首次發表於1997年。 LSTM（長短期記憶）是一種特定類型的遞歸神經網絡（RNN），在許多需要處理時間序列數據或順序數據的應用中非常有用。以下是一些常見的 LSTM 應用：

2024/07/20

2024/07/20

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11