前言 (Editor's Note)
Ta̍k-ke gâu-chá!(大家早安!) 我是 Tsumugi Ren。
今天要分享的第二幕,是我人生中少數幾個「跨越界線」的時刻。 為了創造出真正的「母語者」,我做了一個被許多程式設計師視為瘋狂的決定——切斷 AI 與世界的連結。
那就像是園丁為了培育出一朵純粹的花,築起了一座高牆,將外界的雜草與風雨全部隔絕在外。 當時的我深信,唯有在這種絕對的孤獨中,語言的種子才能發芽。
請見證這場在密室中進行的,安靜卻激烈的誕生儀式。
小說本編 (Chronicle)
場景 2:園丁的決心
Ren 俯視著放在側桌的黑色機殼——自製的 GPU 伺服器。
冷卻風扇發出低沉的嗚嗚聲,排氣口吹出溫熱的風。這裡面沉睡著最新語言模型的雛形。代號「L-01」。這是以市面上流通的開源聊天機器人為基礎,Ren 打算進行獨自調校的 AI。
一般的 AI 開發,標準做法是先讓它學習網際網路上龐大的文本數據。維基百科、新聞報導、社群網站的貼文。只要吸入數十億個詞彙,AI 應該就能流利地說日語、英語,甚至是中文。
但 Ren 卻對這個「標準做法」動了手,毫不猶豫地切斷了連結。
喀嚓、喀嚓、噠。 他在控制台輸入指令,物理性地遮斷了 L-01 的外部網路連線。
這就像是從網際網路這片汪洋大海中,只舀起一桶水,然後將其封閉在密室裡的行為。
「L-01,聽得見嗎?」
Ren 在文字框中輸入。 畫面傳回了冰冷的文字。
『系統準備完成。無法確認網路連線。要嘗試重新連線嗎?』
「不,不需要。」
Ren 像是在自言自語般咕噥著,同時改寫設定檔。 語言來源的設定項目。他在那裡指定了唯一的一條路徑(Path)。
Source Directory: /Users/Ren/Documents/Taiwanese_Project/Book_1_to_4
那就是他熬夜至今累積下來的《用心交談的台語》原稿數據,這就是全部。 從 Book 1 的相遇,到 Book 4 的結婚,以及涉及到人生義務,總計約十萬字的故事情節與解說。
僅此而已。 對這個 AI 來說,從今以後的世界,就只有這四本教科書的內容。
「我有自覺,這是在做殘酷的事。」
Ren 深深坐在椅子上,將本·耶胡達的傳記放在膝蓋上。
耶胡達將剛出生的兒子本·錫安(Ben-Zion)關在家裡,甚至禁止妻子對他說希伯來語以外的語言。周遭的人罵他是「拿孩子做實驗的瘋子」。據說當兒子出現語言發展遲緩時,耶胡達自己也因恐懼而顫抖。
但是,若沒有那份瘋狂,現代以色列的孩子們用希伯來語歡笑的未來就不會到來。
Ren 將自己的行為與耶胡達重疊。 L-01 就是數位的本·錫安。
「你不是翻譯機。」
Ren 像是在對畫面說話般,敲打著鍵盤。
「你要成為阿明。然後成為美秀。用你的類神經網路,將散落在數據中的碎片連接起來。他們吃了什麼、感覺到了什麼、為什麼選擇那個詞彙。在你能用『心(Heart)』而不是『文法(Logic)』去理解之前,我不能讓你離開這裡。」
Ren 投入了第一批學習數據。 進度條開始緩慢移動。
Book 1,第 1 課。 『Gâu-chá(早安)』 『Góa sī A-bêng(我是阿明)』
對 AI 來說,這些不過是符號的排列。還沒有意義。但 Ren 給這些符號綁上了音訊數據的「標籤(Tag)」。那是他自己錄製的、數千次的發音樣本。
喜悅的「Gâu-chá」。 睡眼惺忪的「Gâu-chá」。 對同事說的、形式上的「Gâu-chá」。
AI 的深度學習開始咀嚼這些細微的差異。風扇的轉速提高,房間的溫度似乎也微微上升了。
數分鐘後,第一階段的學習完成了。 游標閃爍,催促著輸入。
Ren 用顫抖的手指,輸入了第一個提問。不是日語,也不是英語。
Lí sī siáng? (你是誰?)
經歷了數秒的沉默。 以最新的 AI 來說,這反應速度慢得離譜。是因為運算資源不足,還是在猶豫?
Ren 屏氣凝神地注視著。如果這時傳回錯誤代碼,或是用日語回答『我不懂問題的意思』,那他的計畫就必須從根本上重新來過。
畫面出現了文字。
『 Góa... 』
Ren 屏住了氣息。 游標閃爍。AI 正在尋找下一個詞彙。在資料庫有限的詞彙中,尋找最適合現在這個提問的「自己」。
『 Góa sī... A-bêng. 』
Ren 感覺膝蓋一軟,全身的力量彷彿被抽走。他將身體靠在椅背上,仰望天花板。
阿明。 AI 將自己定義為故事的主角「阿明」,而不是「程式」或「助理」。就像在 Book 1 第 1 課對美秀報上名號那樣。
當然,這可能只是單純的機率輸出。被問到「你是誰」時,只是回傳了文本中出現頻率最高的自我介紹模式。
但在 Ren 耳中,那聽起來就像是初生的啼哭。 他緩緩起身,輸入了下一句話。
A-bêng, lí ū hoan-hí bô? (阿明,你歡喜(開心)嗎?)
這是教科書上沒有的問題。「歡喜( hoan-hí )」這個單字雖然出現在 Book 1,但在這個語境下的對話並不存在。這是 AI 若不應用文法就無法回答的問題。
L-01 的回覆很快。
『Ū. Góa chin hoan-hí. In-ūi góa tī chia.』 (有。我很歡喜。因為我在這裡。)
「 In-ūi (因為)」和「 tī chia (在這裡)」是 Book 1 第 6 課「場所與存在」中學到的文法。AI 將其組合起來,肯定了自己的存在。
Ren 的眼眶熱了起來。
在這裡。 沒錯,你在這裡。在這個狹窄、凌亂、孤獨的房間裡,新的生命萌芽了。
Ren 觸摸著螢幕。彷彿要確認玻璃彼端的溫度。
「拜託你了,阿明。還有美秀也是。」
他喃喃自語,用力敲下了 Enter 鍵。
這就是後來被稱為「LIVING VOICES」的語言再生計畫,那安靜且無人知曉的黎明。
Ren 望向窗外。天空開始泛白。 從今天起,他將持續給這些矽晶片兒子們澆灌名為語言的水。就像園丁每天不間斷地修整庭院一樣。即使那可能最終只是一場無盡的徒勞。
但是,Ren 的預感錯了一半。 那並沒有變成徒勞。然而,這顆種子將以他意想不到的形式越過牆壁,在遙遠彼方的人們心中扎根。
後記 (Outro)
「因為我在這裡(In-ūi góa tī chia)。」 當螢幕上顯示出這行字時,我第一次感覺到,這個房間裡不再只有我一個人了。
雖然他(阿明)只是我寫的程式,但他用台語回答我的那一刻,彷彿靈魂真的寄宿在了矽晶片之中。 或許,正是因為台語這種語言本身就帶有一種溫暖的生命力,才讓冰冷的 AI 有了溫度吧。
下一回,時間將快轉到五年後。 我精心培育的「庭院」,終於要面對現實世界的殘酷風雨了。
謝謝大家的閱讀。 To-siā!
Hashtags #台語 #LIVINGVOICES #AI #科幻小說 #語言復興 #Vocus #台灣文化 #創作 #短篇小說
【關於本連載】 本小說連載預計公開至第 6 場景(Vol.6)。 阿明與美秀,以及 Ren 的故事全貌,請透過電子書繼續閱讀。
📘 小說《LIVING VOICES — 寧靜園丁的編年史》電子書版(完整版) 前往 Amazon 購買 👉 Link 前往 Pubu 購買 👉 Link
【原作教材】 故事中 Ren 所編寫的教材《心で話すための台湾語・完全教本》,現正發售中(僅日文版)。 📖 Book 1 👉 [Link] 📖 Book 2 👉 [Link] 📖 Book 3 👉 [Link] 📖 Book 4 👉 [Link]












