AI說書 - 從0開始 - 565 | SwinForImageClassification 前言

2025/12/24 更新2025/12/24 發佈閱讀 2 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

Swin 是為電腦視覺設計的通用模型，Swin Transformer 是一種層次化的 Transformer 架構，結合了自注意力和卷積操作來學習圖像表示，這種結構意味著模型前端的區塊從輸入圖像中提取低階特徵，而模型末端的區塊提取高階特徵。

SwinForImageClassification 模型由以下層組成：

Convolutional Stem Layer：負責從輸入圖像中提取初步特徵
一系列 Swin Transformer 區塊：每個區塊由一個自注意力層、一個卷積層和一個殘差連接構成
分類頭：輸出輸入圖像的類別機率

如果要觀看 Swin 模型的堆疊，可以使用以下程式：

model_name = "Denis1976/autotrain-training-cifar-10-81128141660"
model = transformers.AutoModelForImageClassification.from_pretrained(model_name, use_auth_token = token)
print(model.config)

結果為：

Learn AI 不 BI三分鐘學AI (3)AI從0開始-十八章

留言

Learn AI 不 BI

247會員

1.2K內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2025/12/23

AI說書 - 從0開始 - 564 | ViT-base-patch16-224 ImageClassification

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。以下使用 ViT-base-patch16-224 模型執行影像辨識： image_path=”/content/car_in_fog.png” import PIL

2025/12/23

AI說書 - 從0開始 - 564 | ViT-base-patch16-224 ImageClassification

2025/12/22

AI說書 - 從0開始 - 563 | ViTForImageClassification 推論

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。以下使用 ViT 模型執行影像辨識： model_name = "autotrain-training-cifar-10-81128141658" output =

2025/12/22

AI說書 - 從0開始 - 563 | ViTForImageClassification 推論

2025/12/21

AI說書 - 從0開始 - 562 | ViTForImageClassification 前言

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。針對 ViT 模型的描述，模型包含以下部分：圖像編碼器：由一組堆疊的 Transformer 區塊構成，每個 Transformer 區塊包含一個自注意力層、一個卷

2025/12/21

AI說書 - 從0開始 - 562 | ViTForImageClassification 前言

#AI 的其他內容

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

好好宅在家

AI盛行下，我卻感受到「老派」設計的浪漫。

方格子 vocus 官方沙龍

【4月靈感產生器】TOP 100 關鍵字：「○○」格友最愛用

你可能也想看

沒什麼人味的訪談室

AI 繪圖不求人：我如何用「懶人邏輯」打造專屬的提示詞工廠

本文介紹如何運用 Nano Banana Pro (Gemini) 的強大自然語言處理能力，建立一套自動化的 AI 繪圖提示詞產生機制。作者透過定義提示詞架構、建立風格資料庫、以及運用逆向工程，將 AI 從單純的繪圖工具，轉變為能自主生成精美插圖的「提示詞工程師」，大幅提升內容製作效率。

#Gemini#NanoBananaPro#AI實戰心得

2025/12/24

沒什麼人味的訪談室

AI 繪圖不求人：我如何用「懶人邏輯」打造專屬的提示詞工廠

#Gemini#NanoBananaPro#AI實戰心得

2025/12/24

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11