欲善其事,先利其器【2022/10】

更新 發佈閱讀 4 分鐘

2022 年 10 月是創新與挑戰並存的月份,人們進行天馬行空的測試,投石問路功不唐捐,都是疊起人類邁向 AIGC 領域深處的墊腳石。但不知因為抽卡過程充滿趣味性,還是樂於嘗試的人們多少抱持娛樂態度在玩 AI 圖像生成,某些網上分享的範例讓我滿頭問號。


它們未免太長了吧???


若沒特地設置權重,Stable Diffusion 會依提示先後順序安排生成的圖像,調整前面幾個提示詞,可能大幅更動整體構圖與組成。如果單就這個原理推論,提示詞自然越精煉越好,而且使用者最好先對畫面布局/重點元素有基本想法。


然而或許是被那張超長詠唱梗圖影響,AI 生成彷彿也是力大磚飛,圖片不夠完美就 4K、8K、16K 一併塞進去讓它更美,雖然就算疊到 506K,哇塞華氏 451 度紙張燃點,AI 生成多少像素的圖仍舊看你的長寬設定而不是提示詞寫什麼。那段時間尋找網路分享,嘗試在自己筆電重現,總會看到某些揚揚灑灑好似展現分享者經綸滿腹的提示"文稿",的確生成出繁複細緻的精美圖片,仔細比對內文與圖像卻發現其中諸多部份無相關性。


換言之就是電子汽水啊,會讓 prompt 虛胖,用來抽卡很爽。


但對困於 AI 隨機性一個月的我,prompt 與出圖結果沒啥關聯性,實在不是很爽的事情。我越少參考 Reddit/Stable Diffusion 版上帖子,轉向針對共享資料內的特定「單詞」進行單獨測試,這不會帶來重大變革,偏向盤點現有資源,確認哪些二次元角色只要單獨輸入姓名,Novelai 模型即可生成相應人物形象?從東方project 到 FGO、甚至到哈利波特,如果生成模型會受學習資料限制,那作為一名使用者,想發揮最大功能就得先拿捏模型極限。

Novelai眼中的依神女苑

Novelai眼中的依神女苑

Novelai眼中的瑪艾露貝莉·赫恩

Novelai眼中的瑪艾露貝莉·赫恩

Novelai眼中的四季映姬

Novelai眼中的四季映姬


為何尋找有效的人物提示詞?倘若輸入一個詞彙就能表現特定角色,表示我不再需要輸入更多描述體態、穿著的提示詞,如此可以提供更多空間進行場景、動作或其他提示詞的測試。因為 Stable Diffusion 默認有效 token 長度只有 75,超出了這個範圍,無論寫得多天花亂墜都派不上用場。


token 是語言模型裡用數字表現語意的最小單位,不完全等於單詞,受 AI 模型認知影響。若發現沒有學習過的單詞,AI 會將其繼續拆分,直到出現自己可以理解的單位。所以寫篇完整文章丟進 SD 當提示詞,可預見介係詞、連接詞之類不重要的部分也會被劃進 token,難怪 AI 生成圖像會與長文提示詞關聯性不大。


闔上筆電時,常埋怨網上 prompt 怎麼往往無視 75 token 限制,難道大多數人真的只是在玩嗎?隨著情況持續,一股感受油然而生 :


不對勁。


有些提示並非文章格式,且內容與生成圖像相關,但長度怎麼看都必然超出 75 token?


不對勁。


若長提示詞趨勢是缺乏概念的普通民眾湧入造成,為何竟少看見專業人士留言引導群眾?


不對勁。


終於無法按捺好奇心,檢視這些提示詞除了文字本身以外的其他係數。發現 A1111 開發的 Stable Diffusion webUI,在更新中移除了長度限制,可以分組處理超出 75 token 的提示,提升人類輸入對於 AI 的引導能力。


小丑竟是我自己,看來該換工具了。


留言
avatar-img
Bsh的沙龍
3會員
50內容數
記錄我在 2022 年 9 月之後使用 AI 生成圖像的嘗試。 這個主題總有一天會沒東西好寫,那就走一步算一步吧...…
Bsh的沙龍的其他內容
2025/05/06
雖然曾說過,筆電內圖檔、LoRA 要不要刪除,體現內心是否繼續嘗試 AI 創作的躊躇,但硬碟空間剩 2GB 叫我怎麼做事 ? 終歸要刪、終究不得已。
Thumbnail
2025/05/06
雖然曾說過,筆電內圖檔、LoRA 要不要刪除,體現內心是否繼續嘗試 AI 創作的躊躇,但硬碟空間剩 2GB 叫我怎麼做事 ? 終歸要刪、終究不得已。
Thumbnail
2025/04/29
既然 BiliBili 上分享的 LoRA 號稱可一鍵生成漫畫,我決定只寫 prompt 來引導 AI 生成漫畫頁,直到足以拼湊一段劇情為止,再來計算總共生成多少張、又從中採用多少張。
Thumbnail
2025/04/29
既然 BiliBili 上分享的 LoRA 號稱可一鍵生成漫畫,我決定只寫 prompt 來引導 AI 生成漫畫頁,直到足以拼湊一段劇情為止,再來計算總共生成多少張、又從中採用多少張。
Thumbnail
2025/04/22
或許舊作品消滅與 AI 生成風潮,只是證實內心對圖像價值的質疑。諷刺的是,我竟因為懶得開 SD 、漫無目的上網而看到新的可能性。
Thumbnail
2025/04/22
或許舊作品消滅與 AI 生成風潮,只是證實內心對圖像價值的質疑。諷刺的是,我竟因為懶得開 SD 、漫無目的上網而看到新的可能性。
Thumbnail
看更多
你可能也想看
Thumbnail
入選及時精選!! 七月我會努力寫文章的
Thumbnail
入選及時精選!! 七月我會努力寫文章的
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
老朋友、新朋友,大家新年快樂!本文分享我的「2023年閱讀10問」。新的一年,讓我們繼續追求心中所愛的事物,一同熱情分享!
Thumbnail
老朋友、新朋友,大家新年快樂!本文分享我的「2023年閱讀10問」。新的一年,讓我們繼續追求心中所愛的事物,一同熱情分享!
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News