
本文只是經驗分享,並非完美解決方案。
在 AI 生圖的過程上,人物姿勢的控制,"對我而言(使用網路平臺生圖)",一直是個問題,以前會用 LoRA 或 Openpose(ControlNet),但現在(近期),我生圖基本上是使用 Nano-Banana 模型,它沒有LoRA 或 Openpose(ControlNet) 之類的方式了,那麼,人物姿勢的掌握,就只能靠使用文字提示詞來描述嗎?
不,不是這樣的...
Nano-Banana 模型有超強的圖片參照能力,所以,可以試著給他一個姿勢參照圖,請他模仿該姿勢。
比如: 這是女主角的照片。

這是參照圖,檔名: PoseMy.Art_01.png

我使用的生圖指令如下(使用 Gemini):
產生 16:9 比例的橫式圖片,一位 20 歲的台灣女人坐在公園的草地上,身穿黃色洋裝,圖片的視角與人物姿勢請比照 PoseMy.Art_01

出來的照片,就是本文頁首那張照片囉!

請注意: 我雖然在提示詞內,寫了 "圖片的視角"~ 用 "視角" 一詞~ 但我覺得,Nano-Banana 模型看不懂 "視角" 的,所以,我把姿勢圖片換成這張(有點俯視拍攝感覺)時: PoseMy.Art_02.png(OpenPose 線條圖,至於為什麼換成線條圖? 稍後解釋!)

它出現了以下照片~(好像也不能說它錯,線條圖簡略了些!)

其實,我本來參照圖要用下面這張的:

但是,Gemini 一直不肯做圖,會出現 "I'm just a language model and can't help with that.",我剛開始以為是我點數不夠之類的,後來發現,這種圖...可能是被認為為非法( Gemini 大概以為是裸照)的吧,所以不肯做圖。
這實在很 "限制創作自由",哈哈!
不過,我後來把它拿去 TensorArt 試作,是出的來的(Nano-Banana 模型)。

不過,在提示詞處,加了 "拍攝時使用由上而下的無人機空拍"
一位 20 歲的台灣女人坐在公園的草地上,看著鏡頭,笑容開朗,身穿黃色洋裝,圖片的人物姿勢請比照 PoseMy.Art_02,拍攝時使用由上而下的無人機空拍
結果圖片(本圖是本文最完美的一張圖):

我還想深入的試試,於是做了一張參考圖: MyPose02.jpg (本圖片很顯然是俯視視角了!)

直接給 Gemini 以下提示詞(沒有視角說明):

產生 16:9 比例的橫式圖片,一位 20 歲的台灣女人坐在公園的草地上,看著鏡頭,笑容開朗,身穿黃色洋裝,圖片的人物姿勢請比照 MyPose02
出圖結果:

再一次(加上視角說明,沒用)

產生 16:9 比例的橫式圖片,一位 20 歲的台灣女人坐在公園的草地上,看著鏡頭,笑容開朗,身穿黃色洋裝,圖片的人物姿勢和攝影視角比照 MyPose02

告訴它拍攝方式(拍攝時使用由上而下的無人機空拍):
產生 16:9 比例的橫式圖片,一位 20 歲的台灣女人坐在公園的草地上,看著鏡頭,笑容開朗,身穿黃色洋裝,圖片的人物姿勢比照 MyPose02,拍攝時使用由上而下的無人機空拍

結語
以上測試經驗,我個人有幾點結論:
1.可以試著到網路上找出一些想要姿勢的圖片,然後拿來給 Gemini 參照生圖。
2.Gemini 審查...誤判時真不方便。
3.可以參考 "AI 生圖角度轉換教學" ,來調整視角,應可以更靈活生出想要的圖。
其實,我有建議 AutoIP,看能否加一個功能是直接進行圖片的姿勢置換功能,目前是沒有啦,如果他們有做此功能(影片可以喔!),再來分享。



























