上一篇:Week 2|如果明天離職,我還剩下什麼?
提出離職後,我一直在想一個現實問題:
「如果把我在出版社做得最順手的工作流程,抽出來賣,會有人買嗎?」
上一週我盤點離職後的技能,發現自己最拿手的,還是「書籍行銷內容」:寫文案、做影片、規劃曝光。
把「講一本書 → 做成 AI 吉祥物說書短影音」包裝成一個可複製的服務。
流程其實不複雜,難的是:在 60 秒內把一本書講清楚的能力。而且要讓一般人也聽得懂。
服務名稱:1 分鐘 AI 吉祥物短影音。
適合:出版社、內容創作者、機構想推書或其他產品的人。
我會做的事:
- 用 AI+我自己的判斷,抓出這本書的 1~2 個關鍵亮點。
- 生成專屬的吉祥物畫面(或用你既有的角色)。
- 寫出 約 1 分鐘的逐字稿,確保資訊正確+好懂。
- 用 AI 生出語音,剪成可以直接丟 Reels/Shorts 的短影音。
產出內容物:
- 1 支約 1 分鐘的短影音(含字幕)
- 1 段可以重複利用的逐字稿(可做貼文文案)
正文開始:為自己打造一個吉祥物
之前我為公司捏了一隻「神學恐龍大叔」當吉祥物。

短影音:https://youtu.be/JbavD7fdbFU
這次跳開公司,換我為自己捏一隻角色:貓頭鷹忍者,讓他幫我說話。
那我是怎麼做到的呢?大致的流程是這樣子的:
生成角色圖 → 讓角色動起來 → 寫逐字稿 → 配音 → 剪輯 + 上字幕
1.AI生圖
現在用 AI 生圖已經是家常便飯了,門檻很低,若非特殊需求,其實都很夠用。所以我也為自己捏了一個忍者貓頭鷹。

看起來不錯!接下來要讓角色動起來!
2.利用圖片生成角色說話的影片(Image to Video)
現在很多 AI 可供選擇,這次我挑Grok Imagine ,可免費使用而且似乎可以商用。
直接上傳圖片並輸入提示詞:
請產生圖中的角色說話的樣子,可以重複循環播放的頭尾畫面成品如下:
效果好像蠻可愛的,但我需要的是講話的動作,於是將圖片及上述的提示詞交給ChatGPT幫我優化:
請為我生成Grok Imagine圖生影片的提示詞,目標是:產生圖中的角色說話的樣子,可以重複循環播放的頭尾畫面。ChatGPT給我三組選項,我選擇了其中一組:
### 提示詞 2:比較活潑、像解說影片
> seamless looping animation, 3 to 4 seconds, of the same cute owl ninja teacher from the reference image. static front view, no camera motion. the owl explains something excitedly but still cute: beak moves while talking, one wing slightly gestures, eyes blink, eyebrows occasionally raise. soft squash and stretch for extra charm. keep the original warm color palette and flat 2D style. the first and last frame must match so the video can loop smoothly forever.
成品:
看起來更好了!而且還幫忙配音,滿可愛的。
3.故事的逐字稿,生成角色要說的故事
公司出版的書籍大多是英文翻譯書,所以網路上已經有了基本資料及讀者評論了,這時候用Search GPT搜尋書籍的資料,確認搜尋到的內容沒有問題後,再請ChatGPT使用我指定的口吻及閱讀程度來包裝所搜尋到的內容。
這邊我用自己讀過的《信任溝通》來示範。書裡有四種動物溝通模式,我的目標是:
在 60 秒內,把這四種動物的特色講清楚。
與AI協作,做出以下逐字稿:
你有沒有發現,有些人講話很有道理,卻讓人超不想聽?
書籍《信任溝通》說,關鍵是 HEAR。
H 誠實,直接說清楚你想談什麼。
E 同理,先想想對方在擔心什麼。
A 自主,給選擇,而不是命令他。
R 回映,用自己的話重複一次對方剛說的重點。
再看四種「動物模式」:
暴龍型,容易爆氣、想掌控,你要冷靜說明界線。
猴子型,怕冷場一直講笑話,先跟上氣氛,再拉回重點。
獅子型,只想聽結論,先講目標,再補兩三個關鍵資訊。
老鼠型,怕衝突會一直退,放慢速度,多肯定「你可以慢慢說」。
下一次要溝通前,可以想一想:
我有用上 HEAR 嗎?對方比較像哪一種動物?
當你願意先調整自己,溝通就不只是把話說完,而是把話「送到」對方心裡。
如果你有興趣:可以點進去看看我是怎麼生成逐字稿的。
https://chatgpt.com/share/69182a21-bbf4-8007-b006-34148534a9c6
4.讓AI念逐字稿(Text to Speech)
接下來要讓這隻貓頭鷹說話,使用文字轉語音工具,就可以讓這隻貓頭鷹說我想讓他說的任何話了。
我使用的是Google AI Studio (需注意商用問題)及Google Vertex AI (可商用)兩種版本的模型。
5.串在一起並加上字幕
Vertex AI 成品如下:
Google AI Studio 成品如下:
Google AI Studio的版本明顯有抑揚頓挫,柔和許多,不曉得看完影片是否有讓你快速吸收書籍的重點呢?
讓我們簡單回顧一下,我使用了哪些工具?
1.生成一個角色(Text to Image)
2.利用圖片生成角色說話的影片(Image to Video)
3.故事的逐字稿(與AI協作)
4.讓AI念逐字稿(Text to Speech)
5.串在一起並加上字幕(使用剪輯軟體)
這次實驗用到的付費工具,主要是:
- ChatGPT Plus:21 美金/月
- Adobe Premiere Pro:819 元/月
但因為這兩個工具本來就會拿來做其他案子和內容,如果把這支短影音當作「眾多產出中的一個」,
平均分攤下來,這次實驗大概花了我不到一天、約 50 元左右的成本。
這次實驗,我學到什麼?
- 這套流程是可以複製的:
同一套步驟,換一本書、換一個角色就能再做一次。 - 技術問題比想像中小,反而是「故事怎麼講」比較花時間:
要在 60 秒內把一本書講得清楚又易懂,需要下功夫。但這也是我擅長的部份。 - 如果要變成收費服務,還需要多練幾次,
需要找出:平均花多久、可以保證什麼品質、哪些步驟值得自動化。
如果你想一起實驗:我開放 3 個試作名額
你可以帶一本書、一門課、或一個你想推的產品,我們一起用這條流程試試看。歡迎私訊我,聊聊需求,再來談報價!
下一週 Week 4|實驗 02:做出第一個數位小產品,不管賣不賣得掉
這週,我複製了一個在公司想出來的工作流程,並試圖讓這個流程標準化。讓產出的內容可以更加多樣化。
下一週,我將分享我用來管理工作事項的 Notion 範本:
如何從紙本手帳過渡到數位手帳,並管理工作的優先順序。
延伸閱讀:使用工具一覽
生成圖片:ChatGPT
圖生動圖:Grok Imagine
逐字稿:ChatGPT
文字轉語音:Google AI Studio及Google Vertex AI
剪輯軟體:Adobe Premiere Pro
文字轉語音我使用Google AI Studio及Google Vertex AI兩個,由於Google AI Studio的模型是Preview預覽階段,好像也不能真正拿來做商業應用,所以我找到了Google Vertex AI,雖然少了語氣,生硬了點,但至少是可以商用的。不過最適合的應該還是人類自己配音。
這篇文章我想讓讀者都聽聽看兩種聲音的差異,未來也希望找到更自然、適合台灣口音的語音模型。

















