AI說書 - 從0開始 - 111 | Smoothing 方法

2024/08/03 更新2024/08/02 發佈閱讀 1 分鐘

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。

回顧我們在 AI說書 - 從0開始 - 110，介紹了 BLEU 使用方法與公式，現在我們再跑一個例子：

#Example 3 
reference = [['the', 'cat', 'likes', 'milk']] 
candidate = ['the', 'cat', 'enjoys','milk'] 
score = sentence_bleu(reference, candidate) 
print('Example 3', score)

跑出以下結果：

關鍵問題出在：3-Gram 沒有重疊，它建議的選項出現：SmoothingFunction()，我們來看看 Smoothing 是什麼意思。

Chen 與 Cherry 於 2014 年提出一種 Smoothing 方法，Label Smoothing 是一種非常有效的方法，可以提高 Transformer 模型在訓練階段的表現，舉例來說：

我要預測 [mask] 這個字在句子 The cat [mask] milk 中為何，那我的候選名單可能為：

而 Softmax 可能為：

又 One-Hot 為：

這樣一來，Label Smoothing 的運作方式為：

給定一個 Epsilon 參數，假設為 0.25
判斷 Softmax 維度，此例子為 K = 4
One-Hot 中為 0 者，增加為 0 + Epsilon / (K - 1)
One-Hot 中為 1 者，減少為 1 - Epsilon

Learn AI 不 BI三分鐘學AIAI從0開始-第四章

留言

Learn AI 不 BI

247會員

1.2K內容數

這裡將提供： AI、Machine Learning、Deep Learning、Reinforcement Learning、Probabilistic Graphical Model的讀書筆記與演算法介紹，一起在未來AI的世界擁抱AI技術，不BI。

Learn AI 不 BI的其他內容

2024/08/10

AI說書 - 從0開始 - 122 | 第四章額外閱讀項目

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。從 AI說書 - 從0開始 - 99 到 AI說書 - 從0開始 - 121，我們完成書籍：Transformers for Natural Language Proc

2024/08/10

AI說書 - 從0開始 - 122 | 第四章額外閱讀項目

2024/08/09

AI說書 - 從0開始 - 121 | Back-Translation 使用情境

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。我們在 AI說書 - 從0開始 - 120 中使用 Google Gemini 將一段英文翻譯成法文，那我不是法文專業者，怎麼知道翻譯的好不好呢？我可以使用 B

2024/08/09

AI說書 - 從0開始 - 121 | Back-Translation 使用情境

2024/08/09

AI說書 - 從0開始 - 120 | Google Gemini 使用

我想要一天分享一點「LLM從底層堆疊的技術」，並且每篇文章長度控制在三分鐘以內，讓大家不會壓力太大，但是又能夠每天成長一點。現在我們來看看 Google Gemini (https://gemini.google.com/ to start a dialog) 的能力：回答如下：

2024/08/09

AI說書 - 從0開始 - 120 | Google Gemini 使用

看更多

你可能也想看

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

背景：從冷門配角到市場主線，算力與電力被重新定價小P從2008進入股市，每一個時期的投資亮點都不同，記得2009蘋果手機剛上市，當時蘋果只要在媒體上提到哪一間供應鏈，隔天股價就有驚人的表現，當時光學鏡頭非常熱門，因為手機第一次搭上鏡頭可以拍照，也造就傳統相機廠的殞落，如今手機已經全面普及，題

#AI#算力#電力

2026/04/11

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

#AI#算力#電力

2026/04/11