Native Sparse Attention (NSA) 機制概述 Native Sparse Attention

AI.ESG.數位轉型顧問沈重宗

2025/04/21 更新2025/02/18 發佈閱讀 2 分鐘

Native Sparse Attention (NSA) 機制概述

Native Sparse Attention (NSA) 是一種新型的稀疏注意力機制，旨在提高長文本的訓練和推理效率。

這一機制由中國的人工智慧公司 DeepSeek 於 2025 年 2 月 18 日正式發布，並在其技術論文中詳細介紹了其設計理念和核心組件。

NSA 的核心特點

硬體對齊：

NSA 的設計考慮了現代硬體的特性，旨在加速推理過程，同時降低預訓練的成本，而不會犧牲模型的性能。

動態層次稀疏策略：

這一策略結合了粗粒度的標記壓縮和細粒度的標記選擇，能夠在保持全局上下文的同時，顯著提高處理速度。

高效的長文本處理：

NSA 特別適用於超快速的長文本訓練與推理，這使得它在處理大規模數據時表現出色。

技術創新

NSA 機制的創新之處在於其能夠在訓練過程中進行端到端的優化，並在推理階段顯著提高效率。

這一機制的推出被認為是對現有全注意力模型的一次重要補充，因為它在多項基準測試中表現出色，尤其是在長文本任務和基於指令的推理方面。

市場影響

NSA 的發布引起了市場的廣泛關注，相關的 AI 代幣如 SingularityNET (AGIX) 和 Fetch.AI (FET) 在發布後的短時間內出現了顯著的價格上漲，顯示出市場對於 NSA 能夠推動 AI 技術進步的信心。

Native Sparse Attention 機制的推出不僅在技術上具有創新性，還可能對 AI 相關的市場產生深遠的影響。

留言

AI.ESG.數位轉型顧問沈重宗

83會員

640內容數

AI.ESG.數位轉型顧問沈重宗的其他內容

2025/04/30

哈囉～各位關心國際貿易的朋友們！👋 最近美國零售業跟川普政府的關稅大戰簡直比八點檔還精彩啊！😆 讓我們用台灣人最愛的

哈囉～各位關心國際貿易的朋友們！👋 最近美國零售業跟川普政府的關稅大戰簡直比八點檔還精彩啊！😆 讓我們用台灣人最愛的「接地氣」方式，來看看這齣「關稅風暴」到底演到哪一集了～ 🛒 零售巨頭們的「求生實錄」 1. 沃爾瑪帶頭造反？沒錯！根據最新消息，沃爾瑪、塔吉特這

2025/04/30

哈囉～各位關心國際貿易的朋友們！👋 最近美國零售業跟川普政府的關稅大戰簡直比八點檔還精彩啊！😆 讓我們用台灣人最愛的

2025/04/30

砍外包、拼自動化 Duolingo 大變身！🔥宣佈全面擁抱 AI 當「神隊友」💻，執行長 Luis von Ahn

砍外包、拼自動化 Duolingo 大變身！🔥宣佈全面擁抱 AI 當「神隊友」💻，執行長 Luis von Ahn 親曝戰略藍圖：「砍外包、拼自動化，讓員工做更有價值的事！」👊 ✨ 轉型亮點一次看 ✨ 1. AI 接管重複性工作🔄 → 逐步淘汰外包人力，用 A

2025/04/30

砍外包、拼自動化 Duolingo 大變身！🔥宣佈全面擁抱 AI 當「神隊友」💻，執行長 Luis von Ahn

2025/04/30

AI超會答，但你真的會問嗎？🤔 學會「提問力」讓你效率飆升！你是不是也遇過這些狀況？👉 問AI「幫我寫旅遊行

AI超會答，但你真的會問嗎？🤔 學會「提問力」讓你效率飆升！你是不是也遇過這些狀況？👉 問AI「幫我寫旅遊行程」，結果它給你一份「從台北飛巴黎」的夢幻計畫（但預算只有5000台幣😅）；或是請AI寫文案，卻生出一堆「正確但沒人想看」的廢話？問題不在AI，而是你「不會問」！

2025/04/30

AI超會答，但你真的會問嗎？🤔 學會「提問力」讓你效率飆升！你是不是也遇過這些狀況？👉 問AI「幫我寫旅遊行

看更多

你可能也想看

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

這是一場修復文化與重建精神的儀式，觀眾不需要完全看懂《遊林驚夢：巧遇Hagay》，但你能感受心與土地團聚的渴望，也不急著在此處釐清或定義什麼，但你的在場感受，就是一條線索，關於如何找著自己的路徑、自己的聲音。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

釀電影，啜一口電影的美好。

性別之外，存在面前──淺談劇作《遊林驚夢：巧遇 Hagay》

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/03/02

AI.ESG.數位轉型顧問沈重宗

免費增強版 DeepSeek最新更新概述背景信息 DeepSeek是一款由杭州深度求索人工智能基礎技術研究有限公司開發的AI模型，近年來在全球範圍內引起了廣泛關注。其最新版本DeepSeek V3-0324於2025年3月24日發布，標誌著該模型在編程能力、推理能力和上下文理解等多個方面的顯

2025/03/25

2025/03/25

不只DeepSeek！揭密中國AI崛起的秘密武器

阿峰老師解析BBC報導，揭示中國發展AI的「國家隊」策略。其藉由早期STEM教學培養人才、DeepSeek等低成本高效技術、國家強力支持與「彎道超車」創新，全面推動AI融入社會。儘管成就顯著，但國際上對隱私和信任的疑慮仍是其重大挑戰。台灣應借鏡此經驗，思考自身發展路徑。

#AI#AI應用#人工智慧

2025/03/31

AI 峰哥

不只DeepSeek！揭密中國AI崛起的秘密武器

#AI#AI應用#人工智慧

2025/03/31

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11