AI說書 - 從0開始 - 53

LearnAI

發佈於三分鐘學AI

2024/06/26 更新2024/06/26 發佈閱讀 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

在 AI說書 - 從0開始 - 52 中，我們已經解析完 Attention 機制如何運作的，以下延伸至 Multi-Head Attention：

Head 1 說明：

Single-Head Attention 把向量 aⁱ乘上矩陣 W^q變成向量 qⁱ
舉 2-Head 例子來說明
Mulgti-Head Attention 再把向量 qⁱ乘上矩陣 W^q,1變成向量 q^i,1
延續 Single-Head Attention 作法得到 b^i,1

Head 2 說明：

Single-Head Attention 把向量 aⁱ乘上矩陣 W^q變成向量 qⁱ
舉 2-Head 例子來說明
Mulgti-Head Attention 再把向量 qⁱ乘上矩陣 W^q,2變成向量 q^i,2
延續 Single-Head Attention 作法得到 b^i,2

合併：

Mulgti-Head Attention 最後得到的向量 b^i,1與向量 b^i,2，合併後乘上矩陣 W 變成向量 bⁱ
至此的格式就變成跟 Single-Head Attention 一致了

然後有一點要注意，我們為了方便說明，在向量乘法中，我們忽略了一個項目，現實情況的 Transformer 的向量乘法會除上「根號矩陣維度」，而矩陣維度有兩個，其一是 Input Embedding 的維度，而我們選另一個維度，以避免向量越來越長，引起乘法結果越來越大的議題。

講完數學，現在我們來打一點程式說明一下 Multi-Head Attention 的運作機制，為了方便說明，我們把 Input Embedding 的維度由 512 改成 4，此外我指定一個句子只有 3 個字，這樣的小規模，讓大家比較不會害怕：

import numpy as np
from scipy.special import softmax

x = np.array([[1.0, 0.0, 1.0, 0.0],    # Word 1
              [0.0, 2.0, 0.0, 2.0],    # Word 2
              [1.0, 1,0, 1,0, 1,0]])   # Word 3

Learn AI 不 BI三分鐘學AIAI從0開始-第二章

留言

Learn AI 不 BI

247會員

1.2K內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/07/05

AI說書 - 從0開始 - 71

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 37 到 AI說書 - 從0開始 - 70 ，我們完成書籍：Transformers for Natural Language Proc

2024/07/05

AI說書 - 從0開始 - 71

2024/07/04

AI說書 - 從0開始 - 70

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformer 的重要性已經被公認了，因此在 Hugging Face 中亦有被實作，呼叫方式如下： !pip -q install transformers

2024/07/04

AI說書 - 從0開始 - 70

2024/07/02

AI說書 - 從0開始 - 69

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。 Transformers for Natural Language Processing and Computer Vision, 2024 這本書中講 Trainin

2024/07/02

AI說書 - 從0開始 - 69

看更多

你可能也想看

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11