生成世界

含有「生成世界」共 5 篇內容
全部內容
發佈日期由新至舊
在深度學習尚未改寫語音技術之前,工程師面對的問題是「如何用有限而可控的工程手段,把一串文字變成一段勉強自然、但至少可以理解的語音」。早期工程師沒有大型神經網路,也沒有端到端學習可以依賴,因此只能把連續整體的現象拆解成許多可以操作的小問題,再用明確規則、資料庫與訊號處理的方法把它們重新組裝起來。
Thumbnail
AI要生成自然人聲,最困難的地方往往不是「唸對文字」,而是「唸得像真的有人在說」。這意味著模型必須從海量語音資料中,學習發音與韻律之間的複雜關係。它要知道句子的語法結構會如何影響斷句,要知道疑問句、命令句、敘述句在音高上的常見差異,也要知道情緒狀態會如何改變音量、呼吸節奏與起伏幅度。
Thumbnail
「不可完全對象化」所主張的是:對象化有一個邊界。在那個邊界之內,對象化是極其有效的。在那個邊界之外,存在著真實的、重要的、構成人類生活之核心的東西,而這些東西不會因為被對象化的方法所忽略就不存在。世界不可被完全對象化,對世界的技術性對象化,包括世界模型在內,不能取代人對世界的存在性棲居。
Thumbnail
世界模型時代最需要被守護的東西,不是數據安全,不是演算法公平,不是隱私保護,這些都重要,但它們都是在技術的層面上可以處理的問題。最需要被守護的,是一個更根本的、更脆弱的、更不容易被制度化地保護的東西:人的主體性。一個能夠獨立感知世界、獨立形成判斷、獨立做出選擇、並為選擇承擔後果的存在者的那個資格。
Thumbnail
如果有一天 AI 真的能夠「建模世界」,能夠預測世界的變化、模擬行動的後果、甚至生成一個可以被進入和探索的虛擬世界,這將對我們理解「世界」、理解「理解」、理解「人的位置」,產生什麼樣的影響?但在進入這些問題之前,我們先需要理解:「世界模型」究竟是什麼?它與我們已經熟悉的大型語言模型有什麼本質差異?
Thumbnail