【教學-Gradio】打造專屬 AI 繪圖工具(SDXL-Turbo 教學)

更新 發佈閱讀 4 分鐘
vocus|新世代的創作平台

在 AI 技術爆發的時代,擁有一台自己的 AI 繪圖機不再是難事。Hugging Face 提供的 Spaces 功能,讓我們能透過簡單的程式碼,將強大的模型轉化為直觀的操作介面。本文將帶領你深入解析如何利用 Gradio 框架與 SDXL-Turbo 模型,打造一個極速生成的文字繪圖應用。

第一步:建立基礎環境

當你在 Hugging Face 建立一個新的 Space 並選擇 Gradio text-to-image模板時,系統會自動幫你建立三個核心檔案:

  1. app.py:這是應用的靈魂,負責邏輯運算與介面生成。
  2. README.md:定義了 Space 的設定參數(如 SDK 版本、授權條款)。
  3. requirements.txt:列出運行程式碼所需的 Python 套件庫。

預設的模板使用的是 stabilityai/sdxl-turbo。這款模型的特點在於「極速」,它只需要 1 到 4 步的推理就能生成高質量的圖片,非常適合初學者部署。

第二步:解讀 app.py 的關鍵邏輯

app.py 中,有幾個部分是你必須理解的:

  • 模型載入:程式碼會自動判斷你的硬體環境。如果有 GPU,會使用 float16 精度來提升速度;若只有 CPU,則回退到 float32。
  • 生成參數
    • Prompt:你的文字描述。
    • Seed:種子碼。若勾選「Randomize seed」,每次生成的結果都會不同。
    • Inference Steps:推理步數。對於 Turbo 模型,通常設定在 2 步左右即可。
  • Gradio 介面:使用 gr.Blocks 構建,這讓你可以像堆積木一樣設計按鈕、滑桿與顯示框。

第三步:效能飛躍的關鍵——ZeroGPU

這是最重要的一個步驟!預設的免費 Space 通常跑在 CPU 上,出圖速度極慢甚至會報錯。為了獲得流暢體驗,你需要啟動 Hugging Face 的 ZeroGPU 功能:

1. 修改 README.md 標頭

進入 Files 頁面編輯 README.md,在頂部的 YAML 區塊中加入以下設定: factory_accelerator: zero-gpu

2. 啟用程式碼中的加速裝飾器

app.py 中,找到以下兩行並移除前方的井字號(取消註解):

  • import spaces
  • @spaces.GPU(放在 def infer(...) 函數的正上方)

這會讓你的程式在需要生成圖片時,動態調用 Hugging Face 提供的強大 GPU 資源。

第四步:如何操作你的繪圖機

當狀態顯示為綠色的 Running 時,你就可以開始創作了:

  1. 輸入描述:在 Prompt 欄位輸入英文指令,例如 A futuristic cyberpunk city with neon lights
  2. 調整進階設定:點開 Advanced Settings。如果你想要更細緻的畫面,可以稍微調高 Inference steps,但對於 Turbo 模型,建議維持在 4 步以內。
  3. 點擊 Run:等待幾秒鐘,你的 AI 作品就會出現在 Result 區塊中。

結語與進階修改建議

如果你想讓這個 Space 更有個人特色,你可以嘗試修改 app.py 中的 model_repo_id。只要在 Hugging Face 上找到其他相容的 Diffusers 模型(例如動漫風或寫實風),替換掉 ID 後重新部署,你的繪圖機就能擁有完全不同的風格!

留言
avatar-img
Josh的沙龍
15會員
119內容數
分享知識
你可能也想看
Thumbnail
本文帶你三分鐘內跑通"文字生圖片"的網頁APP,使用最頂尖生成技術,LCM-Lora-SDXL模型,能夠在短時間內生成符合文字描述的高解析圖片。屬於免費開源模型(License Link),請不要產生有害內容,進行合理的使用。
Thumbnail
本文帶你三分鐘內跑通"文字生圖片"的網頁APP,使用最頂尖生成技術,LCM-Lora-SDXL模型,能夠在短時間內生成符合文字描述的高解析圖片。屬於免費開源模型(License Link),請不要產生有害內容,進行合理的使用。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成,這聽起來很不可思議對吧? 但這就是本篇論文取得的成就,不僅如此,該有的功能,如調整情感,口音節奏,停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文,這會是很有趣的旅程。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 講完 Transformer 之 Encoder 架構中的 Embedding 與 Positional Encoding 部分,現在進入 Multi-Head Att
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 講完 Transformer 之 Encoder 架構中的 Embedding 與 Positional Encoding 部分,現在進入 Multi-Head Att
Thumbnail
本地端生成式AI工具LM Studio安裝介紹,包含如何手動載入AI模型的技巧。
Thumbnail
本地端生成式AI工具LM Studio安裝介紹,包含如何手動載入AI模型的技巧。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 在AI說書 - 從0開始 - 41中,我們提及 Transformer 的 Encoder 架構如下圖所示,同時我們羅列幾個要點於圖示右邊: 原始 Transform
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 在AI說書 - 從0開始 - 41中,我們提及 Transformer 的 Encoder 架構如下圖所示,同時我們羅列幾個要點於圖示右邊: 原始 Transform
Thumbnail
相信替影片配字幕是許多人心中的痛,本文帶你在三分鐘內能夠用你的電腦,寫出一個使用AI將聲音轉成字幕srt檔案的互動操作網頁,可以連接麥克風測試,也可以上傳聲音檔案或是MP3來測試。目前的多國語言版本,能自動辨別語言,不用特別指定,經實測,中英文混雜也能夠正確輸出。
Thumbnail
相信替影片配字幕是許多人心中的痛,本文帶你在三分鐘內能夠用你的電腦,寫出一個使用AI將聲音轉成字幕srt檔案的互動操作網頁,可以連接麥克風測試,也可以上傳聲音檔案或是MP3來測試。目前的多國語言版本,能自動辨別語言,不用特別指定,經實測,中英文混雜也能夠正確輸出。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
我們已經介紹過關於Transformer模型的平台「【Hugging Face】Ep.1 平凡人也能玩的起的AI平台」,而操作的過程中相信也會有不少玩家會遇到這樣的狀況,因此將遇到的問題整理並分享解決方法,讓需要的朋友可以參考一下。 問題 Input type (torch.FloatTen
Thumbnail
我們已經介紹過關於Transformer模型的平台「【Hugging Face】Ep.1 平凡人也能玩的起的AI平台」,而操作的過程中相信也會有不少玩家會遇到這樣的狀況,因此將遇到的問題整理並分享解決方法,讓需要的朋友可以參考一下。 問題 Input type (torch.FloatTen
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 建議先進入 HuggingFace Meta Llama 頁面:https://huggingface.co/meta-llama 程式為: !pip inst
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 建議先進入 HuggingFace Meta Llama 頁面:https://huggingface.co/meta-llama 程式為: !pip inst
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News