Week 3|實驗 01:把一個熟悉的工作流程,變成可複製服務

更新 發佈閱讀 9 分鐘

上一篇:Week 2|如果明天離職,我還剩下什麼?

提出離職後,我一直在想一個現實問題:
「如果把我在出版社做得最順手的工作流程,抽出來賣,會有人買嗎?」
上一週我盤點離職後的技能,發現自己最拿手的,還是「書籍行銷內容」:寫文案、做影片、規劃曝光。

於是這一週,我決定拿這條最熟悉的流程來做實驗:
把「講一本書 → 做成 AI 吉祥物說書短影音」包裝成一個可複製的服務。
流程其實不複雜,難的是:在 60 秒內把一本書講清楚的能力。而且要讓一般人也聽得懂。

服務名稱:1 分鐘 AI 吉祥物短影音。
適合:出版社、內容創作者、機構想推書或其他產品的人。

我會做的事:

  • 用 AI+我自己的判斷,抓出這本書的 1~2 個關鍵亮點。
  • 生成專屬的吉祥物畫面(或用你既有的角色)。
  • 寫出 約 1 分鐘的逐字稿,確保資訊正確+好懂。
  • 用 AI 生出語音,剪成可以直接丟 Reels/Shorts 的短影音。

產出內容物:

  • 1 支約 1 分鐘的短影音(含字幕)
  • 1 段可以重複利用的逐字稿(可做貼文文案)

正文開始:為自己打造一個吉祥物

之前我為公司捏了一隻「神學恐龍大叔」當吉祥物。

vocus|新世代的創作平台

短影音:https://youtu.be/JbavD7fdbFU

這次跳開公司,換我為自己捏一隻角色:貓頭鷹忍者,讓他幫我說話。

那我是怎麼做到的呢?大致的流程是這樣子的:
生成角色圖 → 讓角色動起來 → 寫逐字稿 → 配音 → 剪輯 + 上字幕

1.AI生圖

現在用 AI 生圖已經是家常便飯了,門檻很低,若非特殊需求,其實都很夠用。所以我也為自己捏了一個忍者貓頭鷹。

vocus|新世代的創作平台

看起來不錯!接下來要讓角色動起來!

2.利用圖片生成角色說話的影片(Image to Video)

現在很多 AI 可供選擇,這次我挑Grok Imagine ,可免費使用而且似乎可以商用
直接上傳圖片並輸入提示詞:

請產生圖中的角色說話的樣子,可以重複循環播放的頭尾畫面

成品如下:

效果好像蠻可愛的,但我需要的是講話的動作,於是將圖片及上述的提示詞交給ChatGPT幫我優化:

請為我生成Grok Imagine圖生影片的提示詞,目標是:產生圖中的角色說話的樣子,可以重複循環播放的頭尾畫面。

ChatGPT給我三組選項,我選擇了其中一組:

### 提示詞 2:比較活潑、像解說影片

> seamless looping animation, 3 to 4 seconds, of the same cute owl ninja teacher from the reference image. static front view, no camera motion. the owl explains something excitedly but still cute: beak moves while talking, one wing slightly gestures, eyes blink, eyebrows occasionally raise. soft squash and stretch for extra charm. keep the original warm color palette and flat 2D style. the first and last frame must match so the video can loop smoothly forever.

成品:

看起來更好了!而且還幫忙配音,滿可愛的。

3.故事的逐字稿,生成角色要說的故事

公司出版的書籍大多是英文翻譯書,所以網路上已經有了基本資料及讀者評論了,這時候用Search GPT搜尋書籍的資料,確認搜尋到的內容沒有問題後,再請ChatGPT使用我指定的口吻及閱讀程度來包裝所搜尋到的內容。

這邊我用自己讀過的《信任溝通》來示範。書裡有四種動物溝通模式,我的目標是:

在 60 秒內,把這四種動物的特色講清楚。

與AI協作,做出以下逐字稿:

你有沒有發現,有些人講話很有道理,卻讓人超不想聽?
書籍《信任溝通》說,關鍵是 HEAR。
H 誠實,直接說清楚你想談什麼。
E 同理,先想想對方在擔心什麼。
A 自主,給選擇,而不是命令他。
R 回映,用自己的話重複一次對方剛說的重點。

再看四種「動物模式」:
暴龍型,容易爆氣、想掌控,你要冷靜說明界線。
猴子型,怕冷場一直講笑話,先跟上氣氛,再拉回重點。
獅子型,只想聽結論,先講目標,再補兩三個關鍵資訊。
老鼠型,怕衝突會一直退,放慢速度,多肯定「你可以慢慢說」。

下一次要溝通前,可以想一想:
我有用上 HEAR 嗎?對方比較像哪一種動物?
當你願意先調整自己,溝通就不只是把話說完,而是把話「送到」對方心裡。

如果你有興趣:可以點進去看看我是怎麼生成逐字稿的。
https://chatgpt.com/share/69182a21-bbf4-8007-b006-34148534a9c6

4.讓AI念逐字稿(Text to Speech)

接下來要讓這隻貓頭鷹說話,使用文字轉語音工具,就可以讓這隻貓頭鷹說我想讓他說的任何話了。
我使用的是Google AI Studio (需注意商用問題)Google Vertex AI (可商用)兩種版本的模型。

5.串在一起並加上字幕

Vertex AI 成品如下:

Google AI Studio 成品如下:

Google AI Studio的版本明顯有抑揚頓挫,柔和許多,不曉得看完影片是否有讓你快速吸收書籍的重點呢?

讓我們簡單回顧一下,我使用了哪些工具?

1.生成一個角色(Text to Image)
2.利用圖片生成角色說話的影片(Image to Video)
3.故事的逐字稿(與AI協作)
4.讓AI念逐字稿(Text to Speech)
5.串在一起並加上字幕(使用剪輯軟體)

這次實驗用到的付費工具,主要是:

  • ChatGPT Plus:21 美金/月
  • Adobe Premiere Pro:819 元/月

但因為這兩個工具本來就會拿來做其他案子和內容,如果把這支短影音當作「眾多產出中的一個」,
平均分攤下來,這次實驗大概花了我不到一天、約 50 元左右的成本

這次實驗,我學到什麼?

  • 這套流程是可以複製的:
    同一套步驟,換一本書、換一個角色就能再做一次。
  • 技術問題比想像中小,反而是「故事怎麼講」比較花時間:
    要在 60 秒內把一本書講得清楚又易懂,需要下功夫。但這也是我擅長的部份。
  • 如果要變成收費服務,還需要多練幾次,
    需要找出:平均花多久、可以保證什麼品質、哪些步驟值得自動化。

如果你想一起實驗:我開放 3 個試作名額

你可以帶一本書、一門課、或一個你想推的產品,我們一起用這條流程試試看。歡迎私訊我,聊聊需求,再來談報價!

下一週 Week 4|實驗 02:做出第一個數位小產品,不管賣不賣得掉

這週,我複製了一個在公司想出來的工作流程,並試圖讓這個流程標準化。讓產出的內容可以更加多樣化。
下一週,我將分享我用來管理工作事項的 Notion 範本:
如何從紙本手帳過渡到數位手帳,並管理工作的優先順序。

延伸閱讀:使用工具一覽

生成圖片:ChatGPT
圖生動圖:Grok Imagine
逐字稿:ChatGPT
文字轉語音:Google AI StudioGoogle Vertex AI
剪輯軟體:Adobe Premiere Pro
文字轉語音我使用Google AI StudioGoogle Vertex AI兩個,由於Google AI Studio的模型是Preview預覽階段,好像也不能真正拿來做商業應用,所以我找到了Google Vertex AI,雖然少了語氣,生硬了點,但至少是可以商用的。不過最適合的應該還是人類自己配音。

這篇文章我想讓讀者都聽聽看兩種聲音的差異,未來也希望找到更自然、適合台灣口音的語音模型。

留言
avatar-img
YT
11會員
68內容數
嗨!我是YT,嘗試將自己的閱讀心得、數位時代的探索心聲及更多內容放在這裡。
你可能也想看
Thumbnail
你是否正在努力創作大量文章呢? 用AI助力你的寫作,你可以將寫作效率提升至一個全新的高度,克服時間瓶頸,總是找得出寫作的靈感! 我與AI助手共事6個月,已經成功幫助我產出200篇發表在方格子的文章🤯! 你也想開始打造自己的寫作流水線嗎?這是我實際驗證後,讓AI助力寫作變得超有效的3個關鍵步驟:
Thumbnail
你是否正在努力創作大量文章呢? 用AI助力你的寫作,你可以將寫作效率提升至一個全新的高度,克服時間瓶頸,總是找得出寫作的靈感! 我與AI助手共事6個月,已經成功幫助我產出200篇發表在方格子的文章🤯! 你也想開始打造自己的寫作流水線嗎?這是我實際驗證後,讓AI助力寫作變得超有效的3個關鍵步驟:
Thumbnail
AI寫小說,這幾個字聽起來像是科幻故事裡才會出現的場景,然而如今已經變成我們生活中可以實驗、可以討論的現實。我曾經看過有人用AI改寫《紅樓夢》,用現代的方式重新鋪陳經典,也有人試圖讓AI模擬不同風格的文學家,甚至模擬金庸、村上春樹的筆觸。我自己也試過很多方法,有時候覺得寫得不錯,有時候卻又覺得那不過
Thumbnail
AI寫小說,這幾個字聽起來像是科幻故事裡才會出現的場景,然而如今已經變成我們生活中可以實驗、可以討論的現實。我曾經看過有人用AI改寫《紅樓夢》,用現代的方式重新鋪陳經典,也有人試圖讓AI模擬不同風格的文學家,甚至模擬金庸、村上春樹的筆觸。我自己也試過很多方法,有時候覺得寫得不錯,有時候卻又覺得那不過
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
每一個期待透過AI進行寫作的創作者,都能夠從這篇文章獲得啟發。 這將可以幫助你提升GPT4的寫作品質,優化輸入與提示的效能。 藉由這三大策略,你將能夠更有效地利用GPT4來創造出豐富且有趣的文章。
Thumbnail
每一個期待透過AI進行寫作的創作者,都能夠從這篇文章獲得啟發。 這將可以幫助你提升GPT4的寫作品質,優化輸入與提示的效能。 藉由這三大策略,你將能夠更有效地利用GPT4來創造出豐富且有趣的文章。
Thumbnail
如果你也與我一樣熱衷於學習,追求效率,語音辨識技術將是你的有力工具! 語音辨識大大增加了我能夠用於創作的時間! 以下是我使用語音辨識技術,優化寫作流程的三個寶貴實踐經驗: 寶貴實踐經驗1 - 以語音辨識技術與GPT進行多重對話,優化閱讀深度:利用語音辨識技術,我可以將自己自言自語的原文,一段一段地閱
Thumbnail
如果你也與我一樣熱衷於學習,追求效率,語音辨識技術將是你的有力工具! 語音辨識大大增加了我能夠用於創作的時間! 以下是我使用語音辨識技術,優化寫作流程的三個寶貴實踐經驗: 寶貴實踐經驗1 - 以語音辨識技術與GPT進行多重對話,優化閱讀深度:利用語音辨識技術,我可以將自己自言自語的原文,一段一段地閱
Thumbnail
話說最近興起了一個AI實驗器ChatGPT,我打算用來當作AI協作寫作的實驗。事實上這個動機很簡單,在我過去的著作裡,我習慣用對話的方式呈現經濟推理的過程,這個對話的對象就是「怡克納米斯」,我把理性經濟學家的角色投射到「怡克納米斯」這個虛擬角色身上。
Thumbnail
話說最近興起了一個AI實驗器ChatGPT,我打算用來當作AI協作寫作的實驗。事實上這個動機很簡單,在我過去的著作裡,我習慣用對話的方式呈現經濟推理的過程,這個對話的對象就是「怡克納米斯」,我把理性經濟學家的角色投射到「怡克納米斯」這個虛擬角色身上。
Thumbnail
大家安安,窩是縱光。 有在關注我的朋友們,應該都知道我最近在寫武俠小說。 老實說,武俠並非我擅長的題材,也不是我常涉獵的故事。之所以想寫,起因是因為一篇大學作業,那個作業希望我們交出三萬字以上的武俠小說,而我當時也寫得非常開心。 然而,因為那終究是作業,有繳交期限,所以我最終是在不完全滿意
Thumbnail
大家安安,窩是縱光。 有在關注我的朋友們,應該都知道我最近在寫武俠小說。 老實說,武俠並非我擅長的題材,也不是我常涉獵的故事。之所以想寫,起因是因為一篇大學作業,那個作業希望我們交出三萬字以上的武俠小說,而我當時也寫得非常開心。 然而,因為那終究是作業,有繳交期限,所以我最終是在不完全滿意
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
這一次,我將和AI機器人談《巷子口經濟學》中的一篇「一杯咖啡的價格」,比較中性的經濟分析,看看AI機器人會如何反應?首先,我請AI機器人扮演怡克納米斯的角色回話,它竟然接受,且以的怡克納米斯角色和我對話。
Thumbnail
這一次,我將和AI機器人談《巷子口經濟學》中的一篇「一杯咖啡的價格」,比較中性的經濟分析,看看AI機器人會如何反應?首先,我請AI機器人扮演怡克納米斯的角色回話,它竟然接受,且以的怡克納米斯角色和我對話。
Thumbnail
語音辨識技術對於任何需要整理和表達想法的人都有著巨大的幫助。 透過這種技術,我們可以更有效地將腦海中的想法轉化為文字,從而將思緒組織得更為清晰。更重要的是,這種方式還可以助力我們增強自我語言能力,提升思考的深度和廣度。 自從我開始使用語音辨識技術以來,我的寫作流程完全改變,能更有效捕捉更多想法,更高
Thumbnail
語音辨識技術對於任何需要整理和表達想法的人都有著巨大的幫助。 透過這種技術,我們可以更有效地將腦海中的想法轉化為文字,從而將思緒組織得更為清晰。更重要的是,這種方式還可以助力我們增強自我語言能力,提升思考的深度和廣度。 自從我開始使用語音辨識技術以來,我的寫作流程完全改變,能更有效捕捉更多想法,更高
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News