MFCC
含有「MFCC」共 1 篇內容
全部內容
發佈日期由新至舊
Dino Lee的AI 智識館
2026/04/16
人工智慧如何生成聲音 第二章_聲音的數位表徵
AI 並不是直接理解「聲音」,而是理解某種表徵。模型實際接觸到的,可能是原始波形,也可能是頻譜圖、Mel 頻譜圖、MFCC,或離散音訊 token。每一種表徵都不是單純的格式差異,而是對聲音資訊的一種重組與取捨。表徵選擇得不同,模型所面對的學習問題就會不同,系統的優勢與限制也會跟著改變。
#
波形
#
傅立葉轉換
#
頻譜圖
1
留言