生成世界

含有「生成世界」共 5 篇內容

全部內容

發佈日期由新至舊

2026/04/19

在深度學習尚未改寫語音技術之前，工程師面對的問題是「如何用有限而可控的工程手段，把一串文字變成一段勉強自然、但至少可以理解的語音」。早期工程師沒有大型神經網路，也沒有端到端學習可以依賴，因此只能把連續整體的現象拆解成許多可以操作的小問題，再用明確規則、資料庫與訊號處理的方法把它們重新組裝起來。

#深度學習 #合成語音 #參數式合成

Dino Lee的AI 智識館

2026/03/31

AI時代的聲音敘事與創作革命第三章　AI人聲：數位靈魂的編碼

AI要生成自然人聲，最困難的地方往往不是「唸對文字」，而是「唸得像真的有人在說」。這意味著模型必須從海量語音資料中，學習發音與韻律之間的複雜關係。它要知道句子的語法結構會如何影響斷句，要知道疑問句、命令句、敘述句在音高上的常見差異，也要知道情緒狀態會如何改變音量、呼吸節奏與起伏幅度。

#AI人聲 #prosody #聲紋提取

Dino Lee的AI 智識館

2026/03/27

世界模型時代＿第六章減少苦難，而非擴大支配

「不可完全對象化」所主張的是：對象化有一個邊界。在那個邊界之內，對象化是極其有效的。在那個邊界之外，存在著真實的、重要的、構成人類生活之核心的東西，而這些東西不會因為被對象化的方法所忽略就不存在。世界不可被完全對象化，對世界的技術性對象化，包括世界模型在內，不能取代人對世界的存在性棲居。

#經驗 #意義 #自由

Dino Lee的AI 智識館

2026/03/24

世界模型時代＿第四章判斷能力的系統性侵蝕

世界模型時代最需要被守護的東西，不是數據安全，不是演算法公平，不是隱私保護，這些都重要，但它們都是在技術的層面上可以處理的問題。最需要被守護的，是一個更根本的、更脆弱的、更不容易被制度化地保護的東西：人的主體性。一個能夠獨立感知世界、獨立形成判斷、獨立做出選擇、並為選擇承擔後果的存在者的那個資格。

如果有一天 AI 真的能夠「建模世界」，能夠預測世界的變化、模擬行動的後果、甚至生成一個可以被進入和探索的虛擬世界，這將對我們理解「世界」、理解「理解」、理解「人的位置」，產生什麼樣的影響？但在進入這些問題之前，我們先需要理解：「世界模型」究竟是什麼？它與我們已經熟悉的大型語言模型有什麼本質差異？

#人工智慧 #模型 #機器人

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌

‌

‌
‌

‌
‌
‌
‌
‌
‌
‌

‌

‌
‌