生成世界
含有「生成世界」共 5 篇內容
全部內容
發佈日期由新至舊
Dino Lee的AI 智識館
2026/04/19
人工智慧如何生成聲音 第四章_早期語音合成方法
在深度學習尚未改寫語音技術之前,工程師面對的問題是「如何用有限而可控的工程手段,把一串文字變成一段勉強自然、但至少可以理解的語音」。早期工程師沒有大型神經網路,也沒有端到端學習可以依賴,因此只能把連續整體的現象拆解成許多可以操作的小問題,再用明確規則、資料庫與訊號處理的方法把它們重新組裝起來。
#
深度學習
#
合成語音
#
參數式合成
1
留言
Dino Lee的AI 智識館
2026/03/31
AI時代的聲音敘事與創作革命 第三章 AI人聲:數位靈魂的編碼
AI要生成自然人聲,最困難的地方往往不是「唸對文字」,而是「唸得像真的有人在說」。這意味著模型必須從海量語音資料中,學習發音與韻律之間的複雜關係。它要知道句子的語法結構會如何影響斷句,要知道疑問句、命令句、敘述句在音高上的常見差異,也要知道情緒狀態會如何改變音量、呼吸節奏與起伏幅度。
#
AI人聲
#
prosody
#
聲紋提取
2
留言
Dino Lee的AI 智識館
2026/03/27
世界模型時代_第六章 減少苦難,而非擴大支配
「不可完全對象化」所主張的是:對象化有一個邊界。在那個邊界之內,對象化是極其有效的。在那個邊界之外,存在著真實的、重要的、構成人類生活之核心的東西,而這些東西不會因為被對象化的方法所忽略就不存在。世界不可被完全對象化,對世界的技術性對象化,包括世界模型在內,不能取代人對世界的存在性棲居。
#
經驗
#
意義
#
自由
1
留言
Dino Lee的AI 智識館
2026/03/24
世界模型時代_第四章 判斷能力的系統性侵蝕
世界模型時代最需要被守護的東西,不是數據安全,不是演算法公平,不是隱私保護,這些都重要,但它們都是在技術的層面上可以處理的問題。最需要被守護的,是一個更根本的、更脆弱的、更不容易被制度化地保護的東西:人的主體性。一個能夠獨立感知世界、獨立形成判斷、獨立做出選擇、並為選擇承擔後果的存在者的那個資格。
#
世界模型
#
AGENT
#
生成世界
3
留言
Dino Lee的AI 智識館
2026/03/20
世界模型時代_序章
如果有一天 AI 真的能夠「建模世界」,能夠預測世界的變化、模擬行動的後果、甚至生成一個可以被進入和探索的虛擬世界,這將對我們理解「世界」、理解「理解」、理解「人的位置」,產生什麼樣的影響?但在進入這些問題之前,我們先需要理解:「世界模型」究竟是什麼?它與我們已經熟悉的大型語言模型有什麼本質差異?
#
人工智慧
#
模型
#
機器人
喜歡
留言