付費限定

《Stable Diffusion 提示詞圖鑑⑥:動漫風格篇》—重打光+重上色

更新 發佈閱讀 10 分鐘

這篇教學會教,如何使用Gemini + Seedream (俗稱即夢),將StableDiffusion產製的圖片重新上色。Seedream 也可以使用 nanobanana pro,但我自己偏好Seedream

可能有人會好奇說,這有什麼難的?用controlNet中的Lineart_anime不就能夠對同樣的圖片重新上色了?沒錯,標準的StableDiffusion工作流就是這樣做的。但麻煩的點在於,每一個重新上色的提示詞等於是要從零開始,從頭來過,還可能需要套用不同的LoRA,試著試著三四個小時就過去了。

而使用Gemini + Seedream,則可以在數十分鐘的時間完成整個工作,而且做得更好!

實際看成果的例子如下:

1.原始StableDiffusion出的圖

vocus|新世代的創作平台

2.使用seedream重上色的圖

vocus|新世代的創作平台
vocus|新世代的創作平台
vocus|新世代的創作平台

很直觀的可以瞭解到,seedream對於整體畫面氛圍的協調性和氣氛的塑造有更強的能力。相比之下Stablediffusion大部分動漫類的CheckPoint雖然人物畫得漂亮,但畫面有些雜亂也沒有一個符合情境的光線佈局。

實作步驟說明

接著按照步驟說明,如何能在數十分鐘內做到這件事情。

1.製作線稿
把SD原稿放入seedream中,提示詞「生成精緻線稿,白底黑線」,即可得線稿如下圖:

vocus|新世代的創作平台
vocus|新世代的創作平台

這個步驟相當於是ControlNet Lineart在做的事情,目的在於先去除掉原圖的色彩資訊,以避免在後續的步驟原圖顏色所帶來的干擾。

2.從Gemini獲得提示詞
這一個步驟我使用了自製的Gem來做,它的功能是收到原圖後,會給出三個他重新設計的情境以及Prompt。像這樣:

vocus|新世代的創作平台

這個Gem的設計有兩個重點:
1.對原圖主體色彩的描述
要求Gemini要把原圖人物的髮色瞳色衣服顏色等等,不想被改變的色彩資訊寫進Prompt裡面。
2.給出的重打光色彩方案,需要給3~5個提案。
這樣做可以最大化Gemini的創意發會,避免每次都給出差不多的色彩與打光提案。

3.用即夢重新上色

從Gemini獲得提示詞後,回到即夢。
把線稿+新提示詞給AI生成

vocus|新世代的創作平台

就拿到圖啦,就是這麼簡單!

最後是付費會員的福利

提供Gemini的Gem連結,以及完整的系統提示詞 (Markdown格式,2,500字)。
希望大家喜歡這一期的內容,
最後跟付費會員說一聲抱歉,這一篇其實是11月號
(對...我拖更了,近期會再補一篇12月號,絕對不會欠過年的啦!)

創作者正在準備中
請加入 幻詠 Gen Ai Studio 了解最新動態!
留言
avatar-img
幻詠 Gen Ai Studio
37會員
133內容數
分享生成式AI 的各領域應用 1. AI 工具(ChatGPT、Gemini、Grok)實測&提示詞技巧 2. AI 創作內容(圖像、影視、動畫)
幻詠 Gen Ai Studio的其他內容
2025/10/08
前一篇探討了如何用ChatGPT、Gemini輔助創作真人風格照片,達到半自動化的生成提示詞的方法。這一篇會進一步介紹動漫風格圖片的流程。 第一步首先會打開預存好提示詞的語言模型。(在ChatGPT裡面叫GPTs,在Gemini裡面是叫Gem)。以Gemini為例,介面如下圖:
Thumbnail
2025/10/08
前一篇探討了如何用ChatGPT、Gemini輔助創作真人風格照片,達到半自動化的生成提示詞的方法。這一篇會進一步介紹動漫風格圖片的流程。 第一步首先會打開預存好提示詞的語言模型。(在ChatGPT裡面叫GPTs,在Gemini裡面是叫Gem)。以Gemini為例,介面如下圖:
Thumbnail
2025/09/08
人工智慧發展快速,最新的繪圖AI像是FLUX、Google nano banana基本上都能以單純的自然語言當作提示詞產生高品質的圖片了。像是Stable Diffusion那樣排比一堆單詞像是魔法詠唱一樣的做法,可能在不遠的將來被淘汰吧。 這個專欄也差不多開始需要轉型,試圖嘗試一種全自動或半自動
Thumbnail
2025/09/08
人工智慧發展快速,最新的繪圖AI像是FLUX、Google nano banana基本上都能以單純的自然語言當作提示詞產生高品質的圖片了。像是Stable Diffusion那樣排比一堆單詞像是魔法詠唱一樣的做法,可能在不遠的將來被淘汰吧。 這個專欄也差不多開始需要轉型,試圖嘗試一種全自動或半自動
Thumbnail
2025/08/01
本期主題由付費學員指定,要教大家怎麼畫角色設定三視圖,或精準一點的說:character sheet 什麼是character sheet? 「Character Sheet」或稱角色設定圖,是一份鉅細靡遺的角色視覺藍圖。它通常會從不同角度繪製角色的完整樣貌,包括正面、側面和背面,以確保外觀的一
Thumbnail
2025/08/01
本期主題由付費學員指定,要教大家怎麼畫角色設定三視圖,或精準一點的說:character sheet 什麼是character sheet? 「Character Sheet」或稱角色設定圖,是一份鉅細靡遺的角色視覺藍圖。它通常會從不同角度繪製角色的完整樣貌,包括正面、側面和背面,以確保外觀的一
Thumbnail
看更多
你可能也想看
Thumbnail
AI 生成圖像最重要的條件之一是提示詞。本篇文章介紹了提示詞的基本概念,並分享了從零開始學習寫圖像生成提示詞的心得,重點著重在基本架構跟新手上路的方向。
Thumbnail
AI 生成圖像最重要的條件之一是提示詞。本篇文章介紹了提示詞的基本概念,並分享了從零開始學習寫圖像生成提示詞的心得,重點著重在基本架構跟新手上路的方向。
Thumbnail
按慣例,"溫紅一杯"逢節日就要應景來玩個AI。這回耶誕節要玩什麼呢?之前兩篇節日AI文都是用Bing Image Creat作皮卡丘的卡通圖,在這篇文章中,我們試用了三種不同的免費AI繪圖生成器:MyEdit、Stable Diffusion、和Bing Image Creat來看看個別成效如何。
Thumbnail
按慣例,"溫紅一杯"逢節日就要應景來玩個AI。這回耶誕節要玩什麼呢?之前兩篇節日AI文都是用Bing Image Creat作皮卡丘的卡通圖,在這篇文章中,我們試用了三種不同的免費AI繪圖生成器:MyEdit、Stable Diffusion、和Bing Image Creat來看看個別成效如何。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
從去年火到現在,相信大家對於 AI 繪圖都不陌生,一夕之間,好像大家都成為藝術家了。 但,看著一張張圖產出了過程,我突然覺得好像少了點什麼? 於是,開始用 AI 來創作諷刺時代的梗圖 於是,開始用 AI 來創造和衝突的和諧 於是,開始用 AI 來幫北極熊發聲
Thumbnail
從去年火到現在,相信大家對於 AI 繪圖都不陌生,一夕之間,好像大家都成為藝術家了。 但,看著一張張圖產出了過程,我突然覺得好像少了點什麼? 於是,開始用 AI 來創作諷刺時代的梗圖 於是,開始用 AI 來創造和衝突的和諧 於是,開始用 AI 來幫北極熊發聲
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本影片使用Stable Diffusion和AnimateDiff等AI技術,在RTX 4060 8GB GPU上生成關於自動駕駛電動車和無人機發射的10秒影片。AnimateDiff方法生成穩定變化的影片,約需40分鐘;Deforum方法則能創造電影級視覺效果,生成時間約15-20分鐘。
Thumbnail
本影片使用Stable Diffusion和AnimateDiff等AI技術,在RTX 4060 8GB GPU上生成關於自動駕駛電動車和無人機發射的10秒影片。AnimateDiff方法生成穩定變化的影片,約需40分鐘;Deforum方法則能創造電影級視覺效果,生成時間約15-20分鐘。
Thumbnail
兩年前的今天,我驚奇發現新買的筆電,恰好達到剛發布沒多久的 Stable diffusion 運轉底線, 從此開啟往後一張 512x768 要等一分鐘,聚沙成塔的日子。
Thumbnail
兩年前的今天,我驚奇發現新買的筆電,恰好達到剛發布沒多久的 Stable diffusion 運轉底線, 從此開啟往後一張 512x768 要等一分鐘,聚沙成塔的日子。
Thumbnail
實際上,筆者的Stable Diffusion (Vlad)依舊有些問題,仍不曉得原因是顯卡、Win11、SSD、Vlad或其他,但會先從更新顯卡驅動和重裝Vlad開始找錯。 現況是Vlad運算了二三張圖後就會因為GPU記憶體不夠的問題開始極度緩慢,因此打擊了我創圖的意願。 另一方面,也是對創作
Thumbnail
實際上,筆者的Stable Diffusion (Vlad)依舊有些問題,仍不曉得原因是顯卡、Win11、SSD、Vlad或其他,但會先從更新顯卡驅動和重裝Vlad開始找錯。 現況是Vlad運算了二三張圖後就會因為GPU記憶體不夠的問題開始極度緩慢,因此打擊了我創圖的意願。 另一方面,也是對創作
Thumbnail
近來生成式AI(Generative Artificial Intelligence)的快速發展,為全球帶了一股衝擊性的產業變革力量,其強大的內容生成能力可有效地支援內容創作者的工作,甚至取代創作者本身。AI取代人類工作的趨勢正快速發展中...
Thumbnail
近來生成式AI(Generative Artificial Intelligence)的快速發展,為全球帶了一股衝擊性的產業變革力量,其強大的內容生成能力可有效地支援內容創作者的工作,甚至取代創作者本身。AI取代人類工作的趨勢正快速發展中...
Thumbnail
喜歡的話,可以拿去當手機桌面,我不介意。要拿去當素材也無妨,不要直接拿去販售就好了,雖然我有用AI繪圖,但好歹也花了不少時間在修圖。
Thumbnail
喜歡的話,可以拿去當手機桌面,我不介意。要拿去當素材也無妨,不要直接拿去販售就好了,雖然我有用AI繪圖,但好歹也花了不少時間在修圖。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News