FastSpeech
含有「FastSpeech」共 1 篇內容
全部內容
發佈日期由新至舊
Dino Lee的AI 智識館
2026/05/02
人工智慧如何生成聲音 第五章_深度學習時代的語音生成架構
深度學習時代語音合成的每一步架構演進,本質上都在重新回答同一個問題:哪些決策應該留給人類先驗,哪些可以交由模型從資料中發現。 從對齊到韻律,從頻譜預測到波形生成,從模組管線到整合式框架,這條線索貫穿了 從Tacotron、FastSpeech、到Matcha-TTS 的所有差異。
#
Tacotron
#
FastSpeech
#
WaveNet
1
留言