延續前一篇文章:從JSON到直接上傳圖片:ChatGPT、Gemini 與 NotebookLM 的仿製技巧,我們談到現在 AI 在「參考圖片風格」與「仿製視覺表現」方面的能力已經愈來愈成熟。過去若想讓 AI 產出接近特定風格的圖片,往往需要透過繁瑣的提示詞設計,甚至要把畫面元素、色彩、構圖、筆觸、角色特徵一一拆解成 JSON 或結構化描述,才能得到較穩定的結果。
但現在,隨著 ChatGPT、Gemini、NotebookLM 等工具陸續強化圖片理解、圖片生成與多模態處理能力,我們已經可以直接上傳參考圖片,讓 AI 分析其風格特色,再依照指定文本產出相近風格的圖像。這讓我開始思考一個更進一步的應用:如果 AI 已經能夠理解並模仿單張圖片的風格,那麼它是否也能根據我們提供的繪圖風格與故事文本,製作出一本完整的繪本呢?因此,這次我想進一步測試不同 AI 工具在「製作繪本」這件事上的實際表現。我會嘗試使用以下三種方式來完成同一個目標:
- NotebookLM 製作繪本
- ChatGPT 製作繪本
- Google Storybook 製作繪本

首先,要來取得繪本的文本。
在 ChatGPT 中使用提示詞:請提供一個繪本的文字內容,共分10段,受眾:小學中年級,主題是和小學生SEL有關。
分幾次重覆執行,得到一些繪本的文本,分別儲存為文字檔。
接著,準備幾個不同風格的圖片。

NotebookLM 製作繪本
先將這些文本和圖片,上傳至 NotebookLM 的新筆記本中。

先勾選一種風格和一個繪本的文本,然後再簡報中自訂指令:
根據上傳的風格和繪本本文,每一張投影片繪製1段的繪本內容,每一頁左側為和文字相關的圖像、右側為文字 ,每張投影片應保持相同風格,人物應一致。

提供的風格:

製作好的繪本:

製成的繪本大多有依選用的風格來設計,而且每一頁文也依提供的內容來呈現。







ChatGPT 製作繪本
先上傳風格圖檔和文本的檔案,然後在 ChatGPT 的對話中,使用提示詞:根據圖片風格和繪本內容繪製每一頁的圖像,3:2格式,每一段文字為一頁,每一頁左側為和文字相關的圖像、右側為文字。繪製1-10頁的繪本內容。
結果可以一次得到 10 張圖片。

自己將圖下載後,插入 PowerPoint 的投影片中。

也可以將繪本的圖直接請 ChatGPT 建立成 PowerPoint 簡報檔
先上傳風格和文本的檔案,再使用提示詞:根據圖片風格和繪本內容繪製每一頁的圖像,3:2 格式,每一段文字為一頁,每一頁左側為和文字相關的圖像、右側為文字。繪製 1-10 頁的繪本內容,並且將繪製好的圖片產生 PowerPoint 簡報檔。
ChatGPT 會依風格先產生這 10 張圖:

接著,會提供 PowerPoint 檔供下載:

Google Storybook 製作繪本
先上傳風格圖檔和文本的檔案,再使用提示詞:根據上傳的風格和繪本本文,每一頁繪製1段的繪本內容,使用上傳的風格和完整文字內容 ,每張投影片應保持相同風格,人物應一致。

檢視製作的結果,每一頁的內容的確有依上傳的文本呈現,但是 Storybook 的風格和上傳的圖片風格有些差距。

















