Frequency Encoding(頻率編碼)

更新 發佈閱讀 2 分鐘

Frequency Encoding(頻率編碼)是將類別變數中的每個類別,依其在資料集中出現的頻率(次數比例)轉換成數值的一種方法。這種方法的核心做法是計算每個類別在樣本中出現的頻率,然後用該頻率值替代原本的類別標籤。

Frequency Encoding的特點包括:

  • 將類別資料轉換為頻率數值,保持類別出現的相對重要性。 不會增加資料維度,適合高基數(類別數多)特徵。 與Label Encoding不同,不會引入虛假的序列關係。 可反映類別出現的普遍程度,對某些模型有助益。

舉例而言,一個城市類別中「台北」出現了100次,「高雄」出現了50次,則台北被編碼為0.67(100/150),高雄為0.33(50/150)。

缺點是:類別頻率相同的會被賦予相同數值,可能導致模型無法區分此類別的細節;此外,它對有序類別並不適合。

總結來說,Frequency Encoding常用於處理類別數量大且頻率分布有意義的資料,能在保持資訊的同時壓縮維度,適合多種機器學習算法。

留言
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
46會員
572內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 初級+中級(數據分析) AWS AIF-C01 AWS CLF-C02 Microsoft AI-900 其他:富邦美術館志工
2025/09/04
Binary Encoding是一種用於機器學習中分類變數編碼的技術,它先將每個類別標籤轉換為整數,然後將這些整數轉換成二進位(binary)數字,最後將二進位的每一位拆分成獨立的欄位。例如,有8個類別時,普通的One-Hot Encoding需要8欄位,而Binary Encoding只需3欄,因
2025/09/04
Binary Encoding是一種用於機器學習中分類變數編碼的技術,它先將每個類別標籤轉換為整數,然後將這些整數轉換成二進位(binary)數字,最後將二進位的每一位拆分成獨立的欄位。例如,有8個類別時,普通的One-Hot Encoding需要8欄位,而Binary Encoding只需3欄,因
2025/09/04
Label Encoding是機器學習中用來將非數值型的類別資料(categorical data)轉換成數值型資料的一種基本技術。它的原理是將每個類別標籤映射成一個獨特的整數值,使得機器學習算法能夠處理這些資料。例如,顏色"red"、"blue"、"green"可分別映射成0、1、2。 Labe
2025/09/04
Label Encoding是機器學習中用來將非數值型的類別資料(categorical data)轉換成數值型資料的一種基本技術。它的原理是將每個類別標籤映射成一個獨特的整數值,使得機器學習算法能夠處理這些資料。例如,顏色"red"、"blue"、"green"可分別映射成0、1、2。 Labe
2025/09/04
Z-Score(標準分數)是衡量一個觀察值距離整體平均值多少個標準差的指標。其基本計算公式為: 其中,X 是原始數據值,μ 是母體或樣本平均值,σ 是母體或樣本標準差。透過此計算,可以知道該數值高於或低於平均數多少個標準差。例如,Z分數為1表示該數值高於平均值一個標準差,為-1表示低於平均值一個標
Thumbnail
2025/09/04
Z-Score(標準分數)是衡量一個觀察值距離整體平均值多少個標準差的指標。其基本計算公式為: 其中,X 是原始數據值,μ 是母體或樣本平均值,σ 是母體或樣本標準差。透過此計算,可以知道該數值高於或低於平均數多少個標準差。例如,Z分數為1表示該數值高於平均值一個標準差,為-1表示低於平均值一個標
Thumbnail
看更多
你可能也想看
Thumbnail
給定一個字串陣列,請把它們所共有的字元伴隨著出現次數輸出。這篇文章介紹如何使用字典統計出現次數,和字典取交集的方法來解決此問題。並提供了複雜度分析和關鍵知識點。
Thumbnail
給定一個字串陣列,請把它們所共有的字元伴隨著出現次數輸出。這篇文章介紹如何使用字典統計出現次數,和字典取交集的方法來解決此問題。並提供了複雜度分析和關鍵知識點。
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
Thumbnail
  最近遇到一些人想做音訊的合成,我回答他或許可以從圖像風格轉換中找到些靈感,我才突然想起我對於這部分的認知只止於知道他能做什麼及結果大概如何,對於內部訓練邏輯及結構並沒有認真的去了解,現在剛好趁此機會好好的學習一下。
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
「蛤!?到底什麼是編碼?網路上都查不到一個簡單的定義!」 剛進研究室的你,被教授指派了許多任務,其中一件是要把質性資料給「編碼」,你是不是也像我一樣霧煞煞QQ 快點進來看看,我幫你統整了一篇簡單易懂的說明,讓你快速了解編碼是什麼!!
Thumbnail
「蛤!?到底什麼是編碼?網路上都查不到一個簡單的定義!」 剛進研究室的你,被教授指派了許多任務,其中一件是要把質性資料給「編碼」,你是不是也像我一樣霧煞煞QQ 快點進來看看,我幫你統整了一篇簡單易懂的說明,讓你快速了解編碼是什麼!!
Thumbnail
理解“是”和“周遍是”的概念至關重要。掌握這些邏輯關係能幫助我們更清晰地思考和分析問題,避免混淆和誤解。這些概念能幫助我們更深入地研究佛法名相(名詞),改變內心認知,達到心靈的平靜和清晰。
Thumbnail
理解“是”和“周遍是”的概念至關重要。掌握這些邏輯關係能幫助我們更清晰地思考和分析問題,避免混淆和誤解。這些概念能幫助我們更深入地研究佛法名相(名詞),改變內心認知,達到心靈的平靜和清晰。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
題目敘述 Sort Array by Increasing Frequency Leetcode #1636 給定一個輸入陣列,請依照出現頻率的多寡從低頻到高頻排列陣列元素。 如果有兩個元素的出現頻率相同,依照元素大小從大到小排列。 測試範例 Example 1: Input: nums
Thumbnail
題目敘述 Sort Array by Increasing Frequency Leetcode #1636 給定一個輸入陣列,請依照出現頻率的多寡從低頻到高頻排列陣列元素。 如果有兩個元素的出現頻率相同,依照元素大小從大到小排列。 測試範例 Example 1: Input: nums
Thumbnail
高中數學主題練習—對數方程式
Thumbnail
高中數學主題練習—對數方程式
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News