Dino Lee
1
位追蹤者
追蹤
Dino Lee
1
位追蹤者
我是 Dino,主修心理學,也是跨域創作者,關注人的存在與幸福。這裡從人工智慧談起,聊技術、也聊人心;談模型與演算法,也談意識、理解與哲學。希望在快速變動的 AI 時代,把知識慢慢轉化為智識,陪你一起思考:科技如何影響我們,又如何好好地Well-Being。
Dino Lee的AI 智識館
4
會員
22
內容數
加入
前往沙龍
這裡是一個探索 人工智慧 × 人文思想 × 跨域研究 的知識空間。 從《深度認識人工智慧》出發,分享 AI 的基礎概念、最新發展,以及它與心理學、哲學、社會的深度對話。
加入
前往沙龍
發佈內容
我的成就
全部內容
由新到舊
Dino Lee的AI 智識館
2026/04/16
人工智慧如何生成聲音 第一章_為什麼要從人工智慧的角度理解聲音生成
聲音生成有一個重要的特點:聲音不是靜態的物件,而是沿著時間展開的動態結構。一段語音或音樂必須隨著時間逐步被感知。它有開始、有延續、有節奏、有轉折;它既包含瞬時的頻率結構,也包含跨越更長時間範圍的韻律與形式。生成聲音不是單純把正確的元素「放上去」就好,而是要讓這些元素在時間中以合理的方式發生。
#
生成式AI
#
聲音生成
#
技術原理
2
留言
Dino Lee的AI 智識館
2026/04/13
並不在場的眼睛與耳朵
重新學會看與聽,最根本的意義是讓你重新成為一個真正活在世界中的人。你不只是經過世界,而是接住世界;不只是知道世界,而是讓世界在你身上留下痕跡。當你真的到場,世界才會開始豐富起來。而那份豐富,正是一切創作、一切理解、甚至一切深刻生活的真正起點。世界從未離開,它只是一直在等待我們回來。
#
感官
#
知覺
#
知覺心理學
1
留言
Dino Lee的AI 智識館
2026/04/03
AI時代的聲音敘事與創作革命 第七章 結語:創作倫理與聲音的未來
即使聲音變成了資料與機率,作品仍然必須回到人的選擇。因為聲音之所以成為故事,不是因為它被算出來,而是因為它被放在恰當的位置、被賦予恰當的關係、被一個有感受與判斷的人選中。AI可以計算相似性,可以生成plausible的結果,但它不自動擁有作品的必要性。那個「必要性」最終仍舊來自於創作者。
#
聲音
#
聲音創作
#
聽覺語彙
3
留言
Dino Lee的AI 智識館
2026/04/03
AI時代的聲音敘事與創作革命 第六章 創作觀點:聲音導演的調度能力
聲音創作的核心不是單點品質,而是整體關係。因此,聲音導演最重要的能力,常常是一種關係感知力。你必須知道哪裡該讓音樂退後,哪裡該讓人聲貼近,哪裡該讓空間突然變空,哪裡該讓一個小小的物件聲變成注意力中心。這種能力與其說是技術,不如說是一種敘事的時間感與感官秩序感。
#
聲音
#
聲音導演
#
場面調度
喜歡
留言
Dino Lee的AI 智識館
2026/04/01
AI時代的聲音敘事與創作革命 第五章 AI音效:語義與空間的重構
「腳步聲」是一個非常模糊的提示。腳步究竟是在木地板上、泥地裡、樓梯間、醫院病房外,還是在濕冷的巷子裡?是急促追趕、偷偷移動,還是疲憊拖行?不同條件會導致聲音的節奏、力度、鞋底材質感、回音長度與整體心理效果完全不同。創作者只輸入「腳步聲」,AI可能給你一段類型中性、功能上無誤、但戲劇上完全無效的結果。
#
擬音
#
聲音素材
#
音效
4
留言
Dino Lee的AI 智識館
2026/04/01
AI時代的聲音敘事與創作革命 第四章 AI音樂:旋律的數學構圖
節奏是時間秩序,它決定作品如何前進,也決定聽者的身體感受會偏向鬆、穩、浮、緊或衝。和聲則像情緒的地基,它會深刻影響聲音的明暗、安定與張力。旋律則比較接近表面的可記憶線索,它常常負責角色感、主題感與情緒聚焦。至於空間感,則關乎音樂是在貼近耳邊、漂浮遠方,還是籠罩整個場景。
#
音樂
#
作曲
#
MIDI
2
留言
Dino Lee的AI 智識館
2026/03/31
AI時代的聲音敘事與創作革命 第三章 AI人聲:數位靈魂的編碼
AI要生成自然人聲,最困難的地方往往不是「唸對文字」,而是「唸得像真的有人在說」。這意味著模型必須從海量語音資料中,學習發音與韻律之間的複雜關係。它要知道句子的語法結構會如何影響斷句,要知道疑問句、命令句、敘述句在音高上的常見差異,也要知道情緒狀態會如何改變音量、呼吸節奏與起伏幅度。
#
AI人聲
#
prosody
#
聲紋提取
2
留言
Dino Lee的AI 智識館
2026/03/31
AI時代的聲音敘事與創作革命 第二章 核心概念:聲音在AI眼中並非波形
現實世界中的聲音,先被數位化成可計算的資料,再被轉換為適合模型處理的表示形式,例如token或其他壓縮編碼;接著,模型在潛在空間中學會不同聲音特徵之間的關係,並透過機率機制,例如自回歸預測或擴散模型去噪,生成新的聲音結果。這整個過程的核心不是「複製現實」,而是「在模式中重新構成可能的現實」。
#
聲音取樣
#
潛在空間
#
機率
1
留言
Dino Lee的AI 智識館
2026/03/31
AI時代的聲音敘事與創作革命 第一章 聲音創作的典範轉移
AI時代的創作者更像是一位導演或策展人,透過清楚的指令、反覆的比較與選擇,讓作品逐步成形。這並不表示技術已經不重要,而是說:技術的重心正在轉移。以前的技術,是如何操作錄音器材與後製軟體;現在的技術,越來越包括如何形成精準的創作意圖、如何轉譯為有效的提示、如何在多個生成版本中做出有審美判斷的選擇。
#
音樂生成
#
聲音生成
#
導演
1
留言
Dino Lee的AI 智識館
2026/03/27
世界模型時代_終章 人的位置
在這個「能做的」急劇擴大的時代,「該不該做」的問題就不再是學術性的了。它變成了一個每天都在發生的、有直接後果的實踐問題。每一次一個世界模型被部署到一個新的應用場景中,都隱含著一個「該不該做」的判斷。而這個判斷的困難之處在於:做出判斷需要的智慧,遠比開發技術需要的智能更難培養、更難傳授、更難規模化。
#
智能
#
智慧
#
社會世界
2
留言