本文整理 Vaerenberg et al.(2014)之研究,回顧不同人工電子耳系統在「聲音強度編碼(Intensity Coding)」上的設計差異與臨床意涵。
內容作為個人學習筆記,同時提供給有需要的臨床人員或相關讀者參考。
https://pubmed.ncbi.nlm.nih.gov/24681426/
一、研究背景:
在人工電子耳(Cochlear Implant, CI)的臨床應用中,「fitting(調機)」
一直是影響預後的關鍵因素之一。
而電子耳的調機到底在處理什麼問題?
在日常生活中,聲音的大小變化其實非常大。
例如:
- 耳語:約 20–30 dB
- 一般對話:約 60–70 dB
- 吵雜環境:約 80–90 dB
也就是說,人類每天接收到的聲音,大約橫跨接近 90 dB 的動態範圍。
為什麼這會變成問題?
人工電子耳在電刺激上,有一個限制:
從「剛好聽得到」到「最大舒適音量」之間的電刺激範圍,通常遠小於聲音本身的動態範圍,文獻指出多數情況下約在一個數量級以內(通常小於 10 dB)
這代表:
我們必須把原本很寬的聲音變化(90 dB),壓縮進一個狹窄的電刺激範圍裡。
這個轉換過程,稱為:
Intensity Coding(強度編碼)
簡單來說,就是把不同大小的聲音,轉換成不同強度的電刺激,並讓使用者感覺是合理且可理解的聲音。
而強度編碼的方式,會影響包含:
- 語音辨識能力
- 聲音的自然度
- 在吵雜環境中的表現
- 聆聽時的負擔感
不同品牌的差異
所有人工電子耳系統都在做「壓縮聲音」這件事,但各品牌在壓縮策略上的設計並不相同。
本篇文獻的重點
本篇文獻(Vaerenberg et al., 2014)嘗試做一件過去較少被完整整理的事情:
用統一的模型,同時比較四大品牌(Cochlear、MED-EL、AB、Neurelec)的聲音處理邏輯
備註:目前在台灣臨床上,主要為三大品牌:Cochlear、MED-EL、AB。因此Neurelec不在此次回顧的討論範圍內。
二、研究設計:比較方法
本研究的核心在於建立一個統一的分析模型,將人工電子耳的聲音處理流程拆解為三個階段:
- 聲學輸入(Acoustic):真實世界的聲音強度(dB SPL)
- 數位處理(Digital):經頻帶分解後的訊號能量(dB FS)
- 電刺激輸出(Electrical):轉換為電極刺激(nC)
此三階段共同構成所謂的:
Intensity Coding Function(ICF)
也就是從「輸入聲音」到「電刺激輸出」的完整轉換關係
相較於僅調整單一參數(如 T-level 或 C-level),ICF 的價值在於:
- 能以同一架構比較不同品牌
- 能觀察參數變動對整體輸出的影響
- 將複雜的聲音處理邏輯視覺化
因此,本研究的重點並非評估哪個系統較佳,而是釐清:
不同系統如何將聲音轉換為電刺激
三、研究發現(一):壓縮是必然,但策略不同
研究指出,所有人工電子耳系統都面臨相同的基本限制:
- 輸入聲音:約 90 dB
- 電刺激範圍:遠小於此(通常 <10 dB)
因此:
所有系統都必須進行大幅度的動態壓縮
關鍵差異並不在於「是否壓縮」,而在於:
壓縮範圍如何設定
文獻中以 IMR(Instantaneous Mapping Range) 描述此概念。
換句話說:
在某一個當下,系統會決定「要處理多大範圍的聲音」
由於電刺激範圍有限,系統無法同時處理所有強度的聲音,因此必須從環境中選擇一段聲音區間進行轉換。
舉例而言,若環境聲音介於 40 dB 到 90 dB:
- 有些系統會選擇較小的範圍(約 40 dB),讓聲音變化被放大、分得更細
- 有些系統則選擇較大的範圍(約 55–60 dB),保留更多整體變化
這個「被選中的聲音範圍」,即為 IMR。
文獻中各品牌的大致設定為:
- Cochlear:約 40 dB
- MED-EL:約 55 dB
- AB:約 60 dB
這代表:
- IMR 較小 → 解析度較高,但聲音範圍被壓縮
- IMR 較大 → 動態資訊較完整,但單位變化解析度較低
亦即:
解析度(resolution)與動態範圍(range)之間的取捨
四、研究發現(二):AGC 與壓縮邏輯差異
除了 IMR 之外,各系統在自動增益控制(AGC)的設計上亦有顯著差異。
Cochlear
採用接近「上限限制」的策略:
當輸入聲音超過一定範圍後,輸出不再隨之增加,而是被限制在最大舒適電刺激(C-level)附近。
文獻中對應的參數為 C-SPL(預設約 65 dB SPL),也就是:
約在此輸入強度之後,系統會透過 AGC 將聲音壓縮,使輸出維持在上限附近
此設計的特性在於:
- 可維持輸出穩定
- 避免過大聲音造成不適
相較之下:
高強度聲音之間的差異會被壓縮,較難被區分
Advanced Bionics(AB)
採用較高壓縮比(約 12:1):
系統透過 AGC,將中到高強度的輸入聲音壓縮至較集中的輸出範圍中。
文獻指出,其 AGC 會在約 60–70 dB SPL 以上開始明顯作用,並隨輸入增加而進行強烈壓縮
此設計的特性在於:
- 能在不同環境音量下維持較一致的輸出
- 減少音量劇烈變化帶來的不穩定感
相較之下:
中高強度聲音之間的差異會被明顯壓縮,聲音層次感可能降低
MED-EL
採用較低壓縮比(約 3:1),並使用雙迴路 AGC(fast + slow):
文獻指出,其 AGC 約在 50–55 dB SPL 左右開始作用,並隨輸入聲音增加進行較為溫和的壓縮
其雙迴路設計包含:
- Fast AGC:快速回應短期聲音變化(避免瞬間過大聲)
- Slow AGC:緩慢調整整體音量(對應環境變化)
此設計的特性在於:
- 壓縮過程較為平滑
- 聲音變化保留較完整
相較之下:
聲音不會被快速壓縮集中,而是維持較連續的強度變化。
五、研究發現(三):表面差異與實際輸出
雖然各品牌使用不同的臨床單位(CL、CU、QU),
但當轉換為實際電荷(nC)後:
多數系統的 loudness growth 呈現近似線性
這表示:
- 表面參數差異明顯
- 最終輸出結果並非完全不同
然而,系統之間的差異仍然存在,其關鍵在於:
輸入聲音如何被轉換與分配
亦即:
- 哪些聲音被保留
- 哪些被壓縮
- 壓縮發生的區間與方式
六、臨床解讀:設計策略的意義
從數據上看,各品牌皆能達到合理的聲音編碼效果,差異並非單純的優劣關係。
但若從設計邏輯來看,則可觀察到不同取向:
各品牌壓縮策略比較
Cochlear
使用類似「上限限制」的機制: 當輸入超過一定 SPL(約對應 C-SPL,預設約 65 dB)後,輸出不再增加,而是維持在上限附近。
特性:
- 輸出穩定
- 高強度聲音被壓在同一區間
- 強調電刺激解析度
Advanced Bionics(AB)
使用高壓縮比(約 12:1): 透過 AGC 將中高強度聲音快速壓縮至較集中的範圍(約 60–70 dB SPL 開始明顯作用)。
特性:
- 聲音變化被快速壓縮
- 輸出一致性高
- 中高音量差異被縮小
MED-EL
使用較低壓縮比(約 3:1),並採用雙迴路 AGC(fast + slow): 約在 50–55 dB SPL 開始作用,進行較為平滑的壓縮。
特性:
- 壓縮較平滑
- 保留較多聲音變化
- 聲音呈現較連續
七、設計取向與臨床意涵
本研究未直接指出哪個系統較佳,但隱含一個重要問題:
在有限的電刺激範圍下,應優先保留什麼?
整理不同策略後,可以看出兩種方向:
- 壓縮聲音,使語音訊號更集中與穩定
- 保留動態,使聲音更接近原始變化
這形成一個核心取捨:
解析度(resolution) vs 聲音動態(dynamic cues)
值得注意的是:
傳統語音測驗主要評估辨識能力,
但不一定能反映聲音品質或聆聽負擔。
因此,即使不同系統在語音測驗表現接近,
在實際聆聽經驗上仍可能存在差異。
八、結論
本研究顯示,人工電子耳系統之間的差異,並不僅在於「是否能聽懂」,而在於:
聲音是如何被轉換與呈現
不同品牌在以下面向上存在設計差異:
- 動態範圍分配
- 壓縮策略
- AGC 設計
因此,人工電子耳的選擇,不僅是技術比較,也涉及對聲音呈現方式的不同取向。
參考文獻
Vaerenberg B, Govaerts PJ, Stainsby T, et al.
A uniform graphical representation of intensity coding in current-generation cochlear implant systems.
Ear Hear. 2014;35(5):533–543.
本文為文獻整理與觀點分享,僅供學術與臨床參考,不作為個別醫療建議。



















