AI 偷走了誰的嗓音?從「人格權」到「聲紋權」的探討與反思

更新 發佈閱讀 16 分鐘

本文副標:當聲音難以被視覺解構,法律是否就該對AI深偽科技下的「聲紋權」議題保持沉默?
本文主旨:淺談「聲紋權」的法律定位、保護力度與相關爭議,並提出判斷框架構想。

背景

延續「上一篇」的背景,一樣是參加著作權工作坊的啟發。筆者諦聽了安藤和宏教授、今村哲也教授的報告,發覺他們於報告中提及了「聲音權利與保護」的相關議題,此亦與我近期撰寫的研究計畫不謀而合!(不過我是探討音樂就是了)

但無論是「聲音」、「聲紋」還是「音樂」,這些都是一種難以「視覺化」、難以「直覺解構」的玩意兒,更別說法律概念了。二位教授也提及,這種關於「音訊」相關的法學討論,尤其在AI世代中,真的少之又少... 欸嘿!我這數位原住民不就來填補缺口了嗎😆

本篇文章,將立基於筆者對音樂本質的理解(時間遞進性、層次堆疊性),並秉持音訊「無法被直觀解構」的核心理念,淺談「聲紋權」的法律議題。



相關案例

J-VOX Pro(日本聲優)

近年來,隨著AI科技的發展,AI Voice(如:Deepfake聲音、AI配音員等)已是屢見不鮮,而這也撼動了日本「聲優」演員們的工作權益,亦有許多聲優的配音錄音檔在未經其同意的狀況下,即被用以訓練AI模型。以下,本文參考安藤和宏教授簡報中的內容,針對「J-VOX Pro」的成立背景與目的進行簡述。

於去年(2025)底,日本演藝協會宣布聯合伊藤忠商事共同成立官方聲音數據庫,以維護聲優以及演員的合法原聲權益。此J-VOX Pro,是一個專門收集聲優、演員等公眾人物聲音的資料庫系統,透過電子透析以及聲波認證的安全技術加持,為未來出現的聲音侵權事件提供公信力證據保障 [1]。

透過集體建立、管理的聲音資料庫,得以便於處理「侵權」與「授權」兩大方面的議題。首先,倘有聲優的配音素材未經其同意而被用以訓練AI模型,透過大型資料庫的比對,或可更加便利舉證「盜取音訊」的行為與揪出原始素材;另外,透過蒐集大量聲優的聲音數據,該系統可訓練一個合法合規、經聲優同意後而為之的AI音訊模型,此亦便於後續商家欲使用該音訊而有明確「付費授權」的管道可供遵循 [2]。

AI 音樂仿作(Chester Bennington)

除了比較學術的案例外,筆者自己在近期也受到AI仿作音樂的洗禮...

於2024年時,沉寂已久的 Linkin Park 驚喜推出了《The Emptiness Machine》單曲,並於2025年時發布其回歸的新專輯〈From Zero〉,正式宣告 Linkin Park 的回歸,同時也迎來了新主唱​ Emily Armstrong。對身為一位深愛Linkin Park前期(Chester 還在世的時候😭)的粉絲而言,能看到 Linkin Park 重新回到螢光幕前真是太開心了!

PS. 我私心也很喜歡 Emily!我覺得她與 Chester 分別給 Linkin Park 帶來了不一樣的色彩~

不過,不少粉絲表示不能理解,認為 Linkin Park 就應該有 Chester 才對味,並對 Emily 進行攻擊... 扯遠了扯遠了,這跟 AI 音樂仿作有啥關係呢?

因為很多粉絲不能接受新主唱的到來,所以有些人私自使用 Chester Bennington 的聲音,以其 Remix 了《The Emptiness Machine》單曲(甚至網路上還有整張專輯Remix的... 於此不贅)。至於這是怎麼辦到的?很簡單(吧),就 AI Deepfake 唄!

AI 影片配音(蔣勳)

高中時讀到「莊子」,就被國文老師推(強)薦(迫)來聽蔣勳的《莊子,你好》相關演講,相信不少人都和我有同樣的感覺,蔣老師的聲音聽著溫柔富有磁性,真是太好聽啦!!😍

啊... 但是呢,各位也知道,有時候家裡長輩總是喜歡看一些AI醫療知識影片(其實就是AI生成出來廣撒的垃圾),我忽然發覺:咦?這不就是蔣勳老師的聲音嗎?!


小結

由此可知,AI 經由訓練的「深度學習」後,Deepfake 出與我們原始聲音特質幾乎完全相似的音訊,已不是什麼新鮮事。那麼,法律又應該如何回應此「侵害」呢?

目前我們有著作權可以用,但它不太好用😅 首先,AI 深度學習所使用的資料(輸入端),有可能構成侵權,但亦有可能被主張轉化性使用而構成「合理使用」,又或者難以舉證到底哪一份錄音著作受到侵害;另外,Deepfake 出來的聲音表現(輸出端)難認屬於著作,有時候亦難構成改作權相關的侵害,屬於裡外不是人了這是...🥲🥲

所以,法律上有認為應回歸「人格權」的探討,認為「我天生的聲音」也構成我整體人格的一部分,應可受到人格權的保護。然而,實務是否採納呢?



臺灣的既有見解探討

憲法法庭 114 年審裁字第 1028 號裁定(連結

臺灣士林地方法院 114 年度聲自字第 16 號刑事裁定(下稱系爭確定終局裁定),認聲紋並非個人資料保護法第 2 條第 1 款之個人資料,係對憲法第 22 條所保障之隱私權、資訊自主權、人格權等,有根本上錯誤之理解,牴觸憲法,聲請裁判憲法審查等語。

由此憲法法庭的裁定可知,憲法法庭肯認「聲紋」係屬隱私權、人格權的範疇,應受到憲法保障。惟此是否係如「肖像權」般地單獨肯認「聲紋權」,尚非無疑。

最高法院 109 年度台抗字第 1650 號刑事裁定(連結

惟考量法院對於參與法庭活動者實施錄音或錄影之主要目的在於輔助筆錄製作,顯係出於執行審判職務之目的需要,而法庭錄音或錄影內容載有參與法庭活動者之聲紋情感活動等內容 ,涉及人性尊嚴一般人格權及資訊自決權等核心價值,為憲法保障人民基本權之範疇,故其蒐集、處理及利用,應兼顧法庭公開與保護個人資訊之衡平性,避免法庭錄音內容遭惡意使用。

最高法院也有類似肯認的見解,不過都僅限於有關「法庭錄音錄影」的「刑事裁定」,仍非民事、商事或競爭法相關的肯認。

小結

綜上見解,其實難以直接得出聲音是一種獨立受保護的「聲紋權」(具體人格權,經由實務判決漸漸予以肯認之)。但我們可以知道,實務上仍然普遍承認聲音是一種受保護的「人格權」(民法§195的概括人格權,也同時牽涉個資法的隱私權)。

然而,這些見解未必能善加解釋「AI Deepfake」浪潮下的聲紋議題。簡言之,目前所探討的「聲音保障」主要係個人的聲音附著於錄音錄影上的情況。然而在「AI Deepfake」的情境之下,AI係使用我的「聲音特質」(Timbre,可以理解為 Raw Material 吧?)生成一段「我根本沒說過的話」,這就是不同所在。

簡單對比一下者兩者的差異:

【現行見解】甲說了「你好,早安,今天天氣好熱」並被錄音,甲之所言附著於音訊檔案中,其聲音受人格權保護(該錄音亦受著作權保障,於此不贅)。

【深偽聲音】甲先前的「你好,早安,今天天氣好熱」錄音檔遭AI深度學習,後產出與甲聲音特質極其相同的音訊檔案:「哈囉,晚安,本週天氣好冷」

前者【現行見解】是保障「真正存在世界上」的聲音;後者【深偽聲音】的漏洞在於,該「哈囉,晚安,本週天氣好冷」的聲音係AI深度學習後產出,基於現行見解下,是否構成侵害甲的聲音權,則有討論空間。



比較法上的見解探討

貓王法案(確保肖像、聲音和圖像安全法案)

美國田納西州有一《Ensuring Likeness, Voice, and Image Security Act》(俗稱:ELVIS Act )的法案,值得我們關注。而本法案,依據筆者的看法,正是打擊 AI Deepfake 最有力的工具!

該本案明確規定:第三人在未得本人之同意下,若意圖利用AI深偽技術生成經仿製偽造變造的圖片、影音、聲音等數位檔案,而後續冒用本人名義進行公開發表或公開演出詞曲創作人及表演藝術工作者之聲音或影像的行為,須承擔相應的民事侵權行為責任 [3]。

由此可知,本法案的射程範圍甚廣。首先,不以「營利」為主要判斷標準,另外輸入端/輸出端均有所規範,可謂周全!

北京互聯網法院(2023)京0491民初12142號 判決

中華人民共和國民法典 第一千零二十三條

對姓名等的許可使用,參照適用肖像許可使用的有關規定。
對自然人聲音的保護,參照適用肖像權保護的有關規定。

本案法官指出:自然人聲音以聲紋、音色、頻率為區分,具有獨特性、唯一性、穩定性特點,能夠給他人形成或引起一般人產生與該自然人有關的思想或感情活動,可以對外展示個人的行為和身份。而本案利用人工智慧合成的聲音,如果能使一般社會公眾或相關領域的公眾根據其音色、語調和發音風格,關聯到該自然人,可以認定為具有可識別性。本案法院認定,原告的聲音具有可識別性,故其聲音明確受到人格權保護 [4]。

應予注意者為,對岸近期亦有(2024)川7101民初8969號判決 作出相反的認定,其以不同的「可識別性」標準來判斷人格權歸屬之論證基礎,可見相關理論基礎未臻完善,尚待進一步討論予以填補。

公開形象權(Right of Publicity)

此涉及商業上的利用,偏向「營利」層面的性質,與本文所欲直接探討的「人格權」層面未盡相同。此部分,筆者已著手撰寫相關的文章,我以後會專門做影片給大家講解XD



本文見解(獨立保護、階層化判斷)

發想背景

於著作權研討會上,今村哲也教授將「愛因斯坦的聲音」播放出來,先詢問我們是否知道這是「愛因斯坦的聲音」,爾後再公布正確解答。藉此,我相信教授是想要帶出兩個觀點:其一,則是聲音單獨判斷較為困難的概念;其二,則是聲音是否具備識別度十分因人而異

於工作坊中,有論者主張:不應該單獨肯認「聲紋權」。因為聲音較難以被直觀解構,或者被認定「具備極高識別性」,其判斷仍需佐以相關肖像、文字的說明。實務上,也多半不會用單純的「聲音相似」(指 Deepfake 情境,非真人模仿)來認定侵害事宜,且通常都是有文字、肖像等輔助判斷之。

現行理論的潛在不足?

本文管見以為,以上論點故有其理論基礎與實務考量,但似乎不能因為「聲音」需要佐以其他要素判斷,就否定其「權利」的定位。另外,我國實務見解雖對聲音肯認其為「人格權」之延伸,但倘若將目光轉移至「AI 深偽技術」所衍生出之音訊,此「人格權」是否仍有適用空間,尚有疑義。

本文主張:獨立保護有其必要性

本文有以下主張,據此認為「聲紋權」具備獨立保護之必要性:

  1. 聲紋權應獨立受保護,然其是否應隸屬於「人格權」,似有進一步討論的空間 [5]。
  2. 人格權本身就看不見摸不著(如:先前實務肯認的遺族追思權)。不得謂其無法被直接解構、常須佐以其他要素判斷,而否定其獨立受保護的可能
  3. 再者,現今 Deepfake 技術發達,很多具備「高度識別度」的聲音單純地被盜用(如先前所述之AI歌手、AI蔣勳聲音),其影片中就算未必有聲紋被盜用者之肖像或相關文字說明,人們依然可以清楚地意識到:這是OOO的聲音,更甚至可能有被聲音誤導的風險(聯想到聲音本人)。

本文構想:階層化的篩漏侵害判斷框架

第一層(其餘要素之直接認定):有鑑於聲音的「難以直接解構性」,若有肖像、姓名、暱稱、文字說明等其餘要素搭配AI深偽的聲音來做使用,應得直接肯認構成「聲紋權」的侵害,無須續行探討。

第二層(聲紋的大眾識別度):如同判斷商標法的識別性一般,判斷聲音本身的是否具備先天識別度(如:特別有磁性的聲音、特別獨樹一格的聲線),另外判斷聲音是否有構成後天識別的可能(如:知名說書人的聲音、著名歌手的唱腔嗓音)。若符合此階層,應認定構成「聲紋權」的侵害。

第三層(聲紋的特定受眾識別度):此外,最後篩漏係「相關領域受眾的熟悉程度」。此聲音特性較不如第二層般具備先天識別度、或普遍使用的後天識別度。然而,考量到相關受眾的背景不甚相同,故本文主張應個案判斷「相關領域受眾識別度」,用以保護小眾歌手的聲紋侵害案,或者有機會延伸處理音訊詐騙的問題。

註:此處使用「識別度」而非「識別性」,目的在於避免聲紋權侵害判斷直接與商標權的概念掛勾。



總結

筆者以為「聲紋權」應該被更細緻化討論,方可真正達成保護目的。故提出上述的審查框架構想,以便有效率、更加系統化地來判斷於AI深偽技術下的「聲紋權」侵害判定,只要符合其中一層的認定,即無須往下篩漏。

第一層次,主要在處理真正「惡意」深偽案件(容易致大眾混淆、明顯存在誤導性的AI內容);第二層次,在處理透過AI模仿知名人士聲音問題(容易讓大眾誤會,但未必有惡意誤導的問題);第三層次,則是深入個案判斷生活中各式各樣的聲紋盜用議題(須個案權衡主觀惡意的輕重、造成的損害等,不宜一刀切)

此外,相關議題亦或可透過《公平交易法》來處理之,如§25的惡意榨取他人努力成果、搭便車規定。希冀得透過筆者的拋磚引玉,促使大家注重「聲紋權」的議題,有任何想法也歡迎底下留言討論~



參考資料

[1] 3DM Game,保障AI時代聲優演員的原聲權益日本演藝協會成立官方資料庫|https://www.3dmgame.com/news/202512/3933107.html

[2] CTC,ITOCHU Announces Launch of Official Japan Actors Union Voice Database: Protecting the Voices of Japan’s Professionals for their Future Career and their Global Reach|https://www.ctc-g.co.jp/en/company/release/20251114-02002.html

[3] 資策會,美國田納西州《確保肖像、聲音和圖像安全法案》要求第三方若利用生成工具重製肖像、聲音或圖像應得本人之事前同意|https://stli.iii.org.tw/article-detail.aspx?no=64&tp=1&d=9195

[4] 北京互聯網法院,全國首例AI生成聲音人格權侵權案一審宣判|https://mp.weixin.qq.com/s/_GxGaG6Q2NYHJWQuOtMyrQ

[5] 不將之強制納入人格權的原因,係聲音具備一定經濟價值,此與肖像權概念類似,若台灣要引入 "Right of Publicity" 的概念,勢必會因為人格權的特性(民法195精神慰撫金)而無法追討財產上的損失與追討利益。此問題仍待後續筆者的深思熟慮以及學說與實務發展。

留言
avatar-img
Dusty K 法律沙龍:音樂x法律的交會點
3會員
45內容數
就讀臺大法律系,是一名遊走於音樂(Hip-Hop, Metalcore, EDM)與法律(智慧財產權法、科技法、AI法)之間的學生,致力於架起「音樂實務」與「法律規範」的橋樑🤘
你可能也想看
Thumbnail
小說:《魔幻傳說最終部》-傑森的末世預言錄第二部《水星之鏡・深淵幻海》尾聲:〈鏡碎之後的真實〉
Thumbnail
小說:《魔幻傳說最終部》-傑森的末世預言錄第二部《水星之鏡・深淵幻海》尾聲:〈鏡碎之後的真實〉
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
*押注緊縮周期近尾聲 道瓊大漲超560點 *美Q3勞動生產力創3年最大增幅 緩解薪資成長 *美初領失業金人數超預期成長 續領創6個月新高 *消費電子復甦帶動 DRAM合約價 迎27個月首漲
Thumbnail
*押注緊縮周期近尾聲 道瓊大漲超560點 *美Q3勞動生產力創3年最大增幅 緩解薪資成長 *美初領失業金人數超預期成長 續領創6個月新高 *消費電子復甦帶動 DRAM合約價 迎27個月首漲
Thumbnail
這幾天,加州台灣人槍擊案兇手周文偉的個人經歷,透過媒體曝光後,總覺得似曾相識,在我機構裡就有類似人生經歷的住民。 「周文偉們」總是重覆類似的故事,到海外之後,生活格格不入,子女、伴侶關係逐漸疏離,接著,「周文偉們」或者他們的子女、伴侶,精神或身心狀況都開始出問題。
Thumbnail
這幾天,加州台灣人槍擊案兇手周文偉的個人經歷,透過媒體曝光後,總覺得似曾相識,在我機構裡就有類似人生經歷的住民。 「周文偉們」總是重覆類似的故事,到海外之後,生活格格不入,子女、伴侶關係逐漸疏離,接著,「周文偉們」或者他們的子女、伴侶,精神或身心狀況都開始出問題。
Thumbnail
  息系魔法師所引導的,正是普依路所引導。息系魔法師所敘說的,正是代言此世之聲。
Thumbnail
  息系魔法師所引導的,正是普依路所引導。息系魔法師所敘說的,正是代言此世之聲。
Thumbnail
特別想來分享一個英國最近的藝文新聞,根據全球軟實力指數報告,英國的軟實力一直名列世界前三...
Thumbnail
特別想來分享一個英國最近的藝文新聞,根據全球軟實力指數報告,英國的軟實力一直名列世界前三...
Thumbnail
伊藤潤二的《人頭氣球》常被解讀為末日恐怖或心理寓言,但若放在今日重新閱讀,會發現它描寫的並非怪物,而是一種高度貼近現實的「仿聲機制」。與現代的電信詐騙、AI 深偽技術驚人地相似——甚至更早指出一個問題:真正危險的,未必是 AI,而是比 AI 更擅長模仿「人」的存在。
Thumbnail
伊藤潤二的《人頭氣球》常被解讀為末日恐怖或心理寓言,但若放在今日重新閱讀,會發現它描寫的並非怪物,而是一種高度貼近現實的「仿聲機制」。與現代的電信詐騙、AI 深偽技術驚人地相似——甚至更早指出一個問題:真正危險的,未必是 AI,而是比 AI 更擅長模仿「人」的存在。
Thumbnail
2025年10月13日〜2025年10月19日,日本輕小說一週銷量排行前10名如下。 1. 在地下城尋求邂逅是否搞錯了什麼21 作者:大森藤野 插畫:安田典生 出版社:軟銀創意 發售日:2025年10月 銷售數:20,745部 2. 黃金神威 鶴見篤四郎的心願 動畫藍光同捆版 原作・
Thumbnail
2025年10月13日〜2025年10月19日,日本輕小說一週銷量排行前10名如下。 1. 在地下城尋求邂逅是否搞錯了什麼21 作者:大森藤野 插畫:安田典生 出版社:軟銀創意 發售日:2025年10月 銷售數:20,745部 2. 黃金神威 鶴見篤四郎的心願 動畫藍光同捆版 原作・
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
新海誠班的方案尾聲。 終於在放假前孩子完成了這件事。 每個方案有開始和結束,都是極有價值的過程。 從研究能源到認識發條、到太陽能⋯的每個發現, 都不斷的在打開孩子的視聽與感受。 最後,決定要把環保愛地球的概念宣導給大家知道。 合力畫圖,為了要讓大家看得清清楚楚兩顆地球的差別。 我覺
Thumbnail
新海誠班的方案尾聲。 終於在放假前孩子完成了這件事。 每個方案有開始和結束,都是極有價值的過程。 從研究能源到認識發條、到太陽能⋯的每個發現, 都不斷的在打開孩子的視聽與感受。 最後,決定要把環保愛地球的概念宣導給大家知道。 合力畫圖,為了要讓大家看得清清楚楚兩顆地球的差別。 我覺
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News