AI 偷走了誰的嗓音？從「人格權」到「聲紋權」的探討與反思

Dusty K

發佈於【智財專欄】

2026/03/05 更新2026/03/03 發佈閱讀 16 分鐘

本文副標：當聲音難以被視覺解構，法律是否就該對AI深偽科技下的「聲紋權」議題保持沉默？
本文主旨：淺談「聲紋權」的法律定位、保護力度與相關爭議，並提出判斷框架構想。

Soundtrap null on Unsplash

背景

延續「上一篇」的背景，一樣是參加著作權工作坊的啟發。筆者諦聽了安藤和宏教授、今村哲也教授的報告，發覺他們於報告中提及了「聲音權利與保護」的相關議題，此亦與我近期撰寫的研究計畫不謀而合！（不過我是探討音樂就是了）

但無論是「聲音」、「聲紋」還是「音樂」，這些都是一種難以「視覺化」、難以「直覺解構」的玩意兒，更別說法律概念了。二位教授也提及，這種關於「音訊」相關的法學討論，尤其在AI世代中，真的少之又少... 欸嘿！我這數位原住民不就來填補缺口了嗎😆

本篇文章，將立基於筆者對音樂本質的理解（時間遞進性、層次堆疊性），並秉持音訊「無法被直觀解構」的核心理念，淺談「聲紋權」的法律議題。

臺灣的既有見解探討

憲法法庭 114 年審裁字第 1028 號裁定（連結）

臺灣士林地方法院 114 年度聲自字第 16 號刑事裁定（下稱系爭確定終局裁定），認聲紋並非個人資料保護法第 2 條第 1 款之個人資料，係對憲法第 22 條所保障之隱私權、資訊自主權、人格權等，有根本上錯誤之理解，牴觸憲法，聲請裁判憲法審查等語。

由此憲法法庭的裁定可知，憲法法庭肯認「聲紋」係屬隱私權、人格權的範疇，應受到憲法保障。惟此是否係如「肖像權」般地單獨肯認「聲紋權」，尚非無疑。

最高法院 109 年度台抗字第 1650 號刑事裁定（連結）

惟考量法院對於參與法庭活動者實施錄音或錄影之主要目的在於輔助筆錄製作，顯係出於執行審判職務之目的需要，而法庭錄音或錄影內容載有參與法庭活動者之聲紋、情感活動等內容，涉及人性尊嚴、一般人格權及資訊自決權等核心價值，為憲法保障人民基本權之範疇，故其蒐集、處理及利用，應兼顧法庭公開與保護個人資訊之衡平性，避免法庭錄音內容遭惡意使用。

最高法院也有類似肯認的見解，不過都僅限於有關「法庭錄音錄影」的「刑事裁定」，仍非民事、商事或競爭法相關的肯認。

小結

綜上見解，其實難以直接得出聲音是一種獨立受保護的「聲紋權」（具體人格權，經由實務判決漸漸予以肯認之）。但我們可以知道，實務上仍然普遍承認聲音是一種受保護的「人格權」（民法§195的概括人格權，也同時牽涉個資法的隱私權）。

然而，這些見解未必能善加解釋「AI Deepfake」浪潮下的聲紋議題。簡言之，目前所探討的「聲音保障」主要係個人的聲音附著於錄音錄影上的情況。然而在「AI Deepfake」的情境之下，AI係使用我的「聲音特質」（Timbre，可以理解為 Raw Material 吧？）生成一段「我根本沒說過的話」，這就是不同所在。

簡單對比一下者兩者的差異：

【現行見解】甲說了「你好，早安，今天天氣好熱」並被錄音，甲之所言附著於音訊檔案中，其聲音受人格權保護（該錄音亦受著作權保障，於此不贅）。

【深偽聲音】甲先前的「你好，早安，今天天氣好熱」錄音檔遭AI深度學習，後產出與甲聲音特質極其相同的音訊檔案：「哈囉，晚安，本週天氣好冷」

前者【現行見解】是保障「真正存在世界上」的聲音；後者【深偽聲音】的漏洞在於，該「哈囉，晚安，本週天氣好冷」的聲音係AI深度學習後產出，基於現行見解下，是否構成侵害甲的聲音權，則有討論空間。

比較法上的見解探討

貓王法案（確保肖像、聲音和圖像安全法案）

美國田納西州有一《Ensuring Likeness, Voice, and Image Security Act》（俗稱：ELVIS Act ）的法案，值得我們關注。而本法案，依據筆者的看法，正是打擊 AI Deepfake 最有力的工具！

該本案明確規定：第三人在未得本人之同意下，若意圖利用AI深偽技術生成經仿製、偽造或變造的圖片、影音、聲音等數位檔案，而後續冒用本人名義進行公開發表或公開演出詞曲創作人及表演藝術工作者之聲音或影像的行為，須承擔相應的民事侵權行為責任 [3]。

由此可知，本法案的射程範圍甚廣。首先，不以「營利」為主要判斷標準，另外輸入端/輸出端均有所規範，可謂周全！

北京互聯網法院（2023）京0491民初12142號判決

中華人民共和國民法典第一千零二十三條

對姓名等的許可使用，參照適用肖像許可使用的有關規定。
對自然人聲音的保護，參照適用肖像權保護的有關規定。

本案法官指出：自然人聲音以聲紋、音色、頻率為區分，具有獨特性、唯一性、穩定性特點，能夠給他人形成或引起一般人產生與該自然人有關的思想或感情活動，可以對外展示個人的行為和身份。而本案利用人工智慧合成的聲音，如果能使一般社會公眾或相關領域的公眾根據其音色、語調和發音風格，關聯到該自然人，可以認定為具有可識別性。本案法院認定，原告的聲音具有可識別性，故其聲音明確受到人格權保護 [4]。

應予注意者為，對岸近期亦有（2024）川7101民初8969號判決作出相反的認定，其以不同的「可識別性」標準來判斷人格權歸屬之論證基礎，可見相關理論基礎未臻完善，尚待進一步討論予以填補。

公開形象權（Right of Publicity）

此涉及商業上的利用，偏向「營利」層面的性質，與本文所欲直接探討的「人格權」層面未盡相同。此部分，筆者已著手撰寫相關的文章，~~我以後會專門做影片給大家講解XD~~

大家好我是老高以後會專門寫一篇文章額外講解XD

本文見解（獨立保護、階層化判斷）

發想背景

於著作權研討會上，今村哲也教授將「愛因斯坦的聲音」播放出來，先詢問我們是否知道這是「愛因斯坦的聲音」，爾後再公布正確解答。藉此，我相信教授是想要帶出兩個觀點：其一，則是聲音單獨判斷較為困難的概念；其二，則是聲音是否具備識別度十分因人而異。

於工作坊中，有論者主張：不應該單獨肯認「聲紋權」。因為聲音較難以被直觀解構，或者被認定「具備極高識別性」，其判斷仍需佐以相關肖像、文字的說明。實務上，也多半不會用單純的「聲音相似」（指 Deepfake 情境，非真人模仿）來認定侵害事宜，且通常都是有文字、肖像等輔助判斷之。

現行理論的潛在不足？

本文管見以為，以上論點故有其理論基礎與實務考量，但似乎不能因為「聲音」需要佐以其他要素判斷，就否定其「權利」的定位。另外，我國實務見解雖對聲音肯認其為「人格權」之延伸，但倘若將目光轉移至「AI 深偽技術」所衍生出之音訊，此「人格權」是否仍有適用空間，尚有疑義。

本文主張：獨立保護有其必要性

本文有以下主張，據此認為「聲紋權」具備獨立保護之必要性：

聲紋權應獨立受保護，然其是否應隸屬於「人格權」，似有進一步討論的空間 [5]。
人格權本身就看不見摸不著（如：先前實務肯認的遺族追思權）。不得謂其無法被直接解構、常須佐以其他要素判斷，而否定其獨立受保護的可能。
再者，現今 Deepfake 技術發達，很多具備「高度識別度」的聲音單純地被盜用（如先前所述之AI歌手、AI蔣勳聲音），其影片中就算未必有聲紋被盜用者之肖像或相關文字說明，人們依然可以清楚地意識到：這是OOO的聲音，更甚至可能有被聲音誤導的風險（聯想到聲音本人）。

本文構想：階層化的篩漏侵害判斷框架

第一層（其餘要素之直接認定）：有鑑於聲音的「難以直接解構性」，若有肖像、姓名、暱稱、文字說明等其餘要素搭配AI深偽的聲音來做使用，應得直接肯認構成「聲紋權」的侵害，無須續行探討。

第二層（聲紋的大眾識別度）：如同判斷商標法的識別性一般，判斷聲音本身的是否具備先天識別度（如：特別有磁性的聲音、特別獨樹一格的聲線），另外判斷聲音是否有構成後天識別的可能（如：知名說書人的聲音、著名歌手的唱腔嗓音）。若符合此階層，應認定構成「聲紋權」的侵害。

第三層（聲紋的特定受眾識別度）：此外，最後篩漏係「相關領域受眾的熟悉程度」。此聲音特性較不如第二層般具備先天識別度、或普遍使用的後天識別度。然而，考量到相關受眾的背景不甚相同，故本文主張應個案判斷「相關領域受眾識別度」，用以保護小眾歌手的聲紋侵害案，或者有機會延伸處理音訊詐騙的問題。

_{註：此處使用「識別度」而非「識別性」，目的在於避免聲紋權侵害判斷直接與商標權的概念掛勾。}

總結

筆者以為「聲紋權」應該被更細緻化討論，方可真正達成保護目的。故提出上述的審查框架構想，以便有效率、更加系統化地來判斷於AI深偽技術下的「聲紋權」侵害判定，只要符合其中一層的認定，即無須往下篩漏。

第一層次，主要在處理真正「惡意」深偽案件（容易致大眾混淆、明顯存在誤導性的AI內容）；第二層次，在處理透過AI模仿知名人士聲音問題（容易讓大眾誤會，但未必有惡意誤導的問題）；第三層次，則是深入個案判斷生活中各式各樣的聲紋盜用議題（須個案權衡主觀惡意的輕重、造成的損害等，不宜一刀切）

此外，相關議題亦或可透過《公平交易法》來處理之，如§25的惡意榨取他人努力成果、搭便車規定。希冀得透過筆者的拋磚引玉，促使大家注重「聲紋權」的議題，有任何想法也歡迎底下留言討論～

參考資料

[1] 3DM Game，保障AI時代聲優演員的原聲權益日本演藝協會成立官方資料庫｜https://www.3dmgame.com/news/202512/3933107.html

[2] CTC，ITOCHU Announces Launch of Official Japan Actors Union Voice Database: Protecting the Voices of Japan’s Professionals for their Future Career and their Global Reach｜https://www.ctc-g.co.jp/en/company/release/20251114-02002.html

[3] 資策會，美國田納西州《確保肖像、聲音和圖像安全法案》要求第三方若利用生成工具重製肖像、聲音或圖像應得本人之事前同意｜https://stli.iii.org.tw/article-detail.aspx?no=64&tp=1&d=9195

[4] 北京互聯網法院，全國首例AI生成聲音人格權侵權案一審宣判｜https://mp.weixin.qq.com/s/_GxGaG6Q2NYHJWQuOtMyrQ

[5] 不將之強制納入人格權的原因，係聲音具備一定經濟價值，此與肖像權概念類似，若台灣要引入 "Right of Publicity" 的概念，勢必會因為人格權的特性（民法195精神慰撫金）而無法追討財產上的損失與追討利益。此問題仍待後續筆者的深思熟慮以及學說與實務發展。

Dusty K 法律沙龍：音樂x法律的交會點【智財專欄】

留言

Dusty K 法律沙龍：音樂x法律的交會點

3會員

45內容數

就讀臺大法律系，是一名遊走於音樂（Hip-Hop, Metalcore, EDM）與法律（智慧財產權法、科技法、AI法）之間的學生，致力於架起「音樂實務」與「法律規範」的橋樑🤘

你可能也想看

阿安的沙龍

小說:《魔幻傳說最終部》-傑森的末世預言錄第二部《水星之鏡・深淵幻海》尾聲：〈鏡碎之後的真實〉

#小說#水星#魔法

2025/11/01

阿安的沙龍

小說:《魔幻傳說最終部》-傑森的末世預言錄第二部《水星之鏡・深淵幻海》尾聲：〈鏡碎之後的真實〉

#小說#水星#魔法

2025/11/01

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

背景：從冷門配角到市場主線，算力與電力被重新定價小P從2008進入股市，每一個時期的投資亮點都不同，記得2009蘋果手機剛上市，當時蘋果只要在媒體上提到哪一間供應鏈，隔天股價就有驚人的表現，當時光學鏡頭非常熱門，因為手機第一次搭上鏡頭可以拍照，也造就傳統相機廠的殞落，如今手機已經全面普及，題

#AI#算力#電力

2026/04/11

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

#AI#算力#電力

2026/04/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11