NAMMs 模仿人類記憶的選擇性保留和捨棄機制

更新 發佈閱讀 2 分鐘
vocus|新世代的創作平台

想像一下,我們的大腦很厲害,能記住重要的東西,忘記不重要的細節。現在,有一種很酷的新技術叫做 “神經注意力記憶模型”(NAMM),它可以讓 Transformer 模型也像我們的大腦一樣聰明!

Transformer 模型就像語言模型的骨幹,它可以處理文字、圖片等等。但它們有一個問題,就是會一股腦地記住所有東西,就像一個塞滿東西的倉庫,很難快速找到需要的資訊。

經過語言訓練的完全進化的 NAMM 可以零樣本轉移到其他 Transformer,甚至跨輸入模式和任務域!

經過語言訓練的完全進化的 NAMM 可以零樣本轉移到其他 Transformer,甚至跨輸入模式和任務域!


NAMM 就像一個聰明的管理員,它會學習哪些資訊重要,哪些不重要。它會 “保留重要的資訊,丟掉不重要的雜訊”,讓 Transformer 模型運作更有效率。

NAMM 的厲害之處:

它可以讓 Transformer 模型在處理語言和寫程式碼時表現更好,而且還更省記憶體!
它可以應用在各種領域,像是視覺、機器人控制等等,即使它只接受過語言訓練!
它可以像玩樂高積木一樣,直接套用在不同的 Transformer 模型上,不需要重新訓練!

簡單來說,NAMM 就像給 Transformer 模型裝了一個升級版大腦,讓它們變得更聰明、更快速、更靈活!

透過進化優化、迭代變異和選擇網路參數來優化 NAMM,從而透過我們的新記憶系統產生最佳的語言建模表現。

透過進化優化、迭代變異和選擇網路參數來優化 NAMM,從而透過我們的新記憶系統產生最佳的語言建模表現。


研究人員還發現,NAMM 在處理不同任務時,會記住不同的資訊。例如,在處理程式碼時,它會刪除不必要的空格和註釋;而在處理自然語言時,它會忽略一些語法上的冗詞,專注於關鍵字和重要概念。

這項技術非常有潛力,未來可能會讓 transformer 模型 變得更強大,甚至可以像我們人類一樣,透過學習和記憶的迭代過程,不斷進化!


留言
avatar-img
解浩靈的思考和紀錄本
10會員
197內容數
協助解決中小型製造企業數位轉型問題,傳產公司的痛點是缺乏 IT專業人才,我們提供便捷的智慧物聯網系統“EDC高效資料收集與分散式控制系統”。協助貴公司非專業人員短期培訓,即可自主完成物聯網部署,快速實現資料採集、資料可視、資料存儲和資料分析,助力傳統製造中小企業的數位轉型! 業務營銷|專案管理|工廠營運|跨業合作
2025/04/27
Sam Altman在TED 2025的演講內容 天文學家發現了正在快速瓦解並產生彗星尾巴的行星 高效資料收集與分散式控制(EDC)技術及其應用 以及40年前一本書對未來的預測,並比較其預測與當今科技發展的吻合程度。
Thumbnail
2025/04/27
Sam Altman在TED 2025的演講內容 天文學家發現了正在快速瓦解並產生彗星尾巴的行星 高效資料收集與分散式控制(EDC)技術及其應用 以及40年前一本書對未來的預測,並比較其預測與當今科技發展的吻合程度。
Thumbnail
2025/04/20
Y Combinator:為什麼垂直 AI 代理的規模可能比 SaaS 大10倍 思維邏輯自我訓練方案 中國沒有不痛,但選擇了不跪 《黑鏡》的陰影:當悲觀論述獨舞,我們該如何擁抱科技的未來?
Thumbnail
2025/04/20
Y Combinator:為什麼垂直 AI 代理的規模可能比 SaaS 大10倍 思維邏輯自我訓練方案 中國沒有不痛,但選擇了不跪 《黑鏡》的陰影:當悲觀論述獨舞,我們該如何擁抱科技的未來?
Thumbnail
2025/03/20
全球約有 12 分之 1 的男性是色盲,其中紅綠色盲最為常見,顏色在設計中不應是唯一的意義傳達方式。以葉子為例,假設我們設計一個應用程式來區分葉子的健康狀態,若僅用綠色表示健康、紅色表示枯萎,色盲使用者可能無法分辨。 色盲的普遍性與設計挑戰約有12分之一的男性(即約8%的人口)患有色盲,其中紅
Thumbnail
2025/03/20
全球約有 12 分之 1 的男性是色盲,其中紅綠色盲最為常見,顏色在設計中不應是唯一的意義傳達方式。以葉子為例,假設我們設計一個應用程式來區分葉子的健康狀態,若僅用綠色表示健康、紅色表示枯萎,色盲使用者可能無法分辨。 色盲的普遍性與設計挑戰約有12分之一的男性(即約8%的人口)患有色盲,其中紅
Thumbnail
看更多
你可能也想看
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
對比電腦,大腦就是人體的中央處理器(CPU)。大腦的功能繁多,其中有關於記憶學習,儲存知識,神經中樞,情緒管控等等,對人體的重性自然不在話下。就像電腦一樣,人腦也像是一個專屬的資料庫,它紀錄了人生道路的點點滴滴,它以記憶的形式保存在特定的角落,就像電腦的中央處理器一樣。只是,由於電腦是當今科技的產物
Thumbnail
對比電腦,大腦就是人體的中央處理器(CPU)。大腦的功能繁多,其中有關於記憶學習,儲存知識,神經中樞,情緒管控等等,對人體的重性自然不在話下。就像電腦一樣,人腦也像是一個專屬的資料庫,它紀錄了人生道路的點點滴滴,它以記憶的形式保存在特定的角落,就像電腦的中央處理器一樣。只是,由於電腦是當今科技的產物
Thumbnail
LSTM 是記憶力加強版的 RNN,能判斷哪些資訊該記、哪些該忘,特別適合處理語音、文字、股市等時間序列資料。它透過記憶門控機制,解決了 RNN 容易忘記前面訊息的缺點,是 AI 世界裡的「聰明筆記王」。
Thumbnail
LSTM 是記憶力加強版的 RNN,能判斷哪些資訊該記、哪些該忘,特別適合處理語音、文字、股市等時間序列資料。它透過記憶門控機制,解決了 RNN 容易忘記前面訊息的缺點,是 AI 世界裡的「聰明筆記王」。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
要打破舊自我的習慣,你的思考必須凌駕你的生活環境,必須超越已經記憶在身體裡的感受,並以一個新的時間線來生活。 如果你想要改變,就必須在心裡預想一個理想化的自我,一個你可以仿效的良好模範,不同於存在於你目前所處的環境、身體和時間裡的那個「你」。
Thumbnail
要打破舊自我的習慣,你的思考必須凌駕你的生活環境,必須超越已經記憶在身體裡的感受,並以一個新的時間線來生活。 如果你想要改變,就必須在心裡預想一個理想化的自我,一個你可以仿效的良好模範,不同於存在於你目前所處的環境、身體和時間裡的那個「你」。
Thumbnail
在人類記憶潛能中,我們探討了如何在科技的便利中找回核心記憶能力。記憶宮殿這樣古老的技術,利用空間與圖像的轉化,讓抽象的資訊具象化並牢記於心。此外,雖然現代科技改變了我們保存知識的方式,但透過有效的訓練,我們仍可強化記憶並增進自我認知。
Thumbnail
在人類記憶潛能中,我們探討了如何在科技的便利中找回核心記憶能力。記憶宮殿這樣古老的技術,利用空間與圖像的轉化,讓抽象的資訊具象化並牢記於心。此外,雖然現代科技改變了我們保存知識的方式,但透過有效的訓練,我們仍可強化記憶並增進自我認知。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
當代認知神經科學_腦與心智 清大通識第十二週心得分享
Thumbnail
當代認知神經科學_腦與心智 清大通識第十二週心得分享
Thumbnail
在上一篇文章中,我向讀者粗略探討人工智能的普及化如何影響我們未來的工作模式。 其實除了人工智能外,還有另一種比較鮮為人知的技術,未來亦會完全改變我們的生活。 它就是腦機相關技術。
Thumbnail
在上一篇文章中,我向讀者粗略探討人工智能的普及化如何影響我們未來的工作模式。 其實除了人工智能外,還有另一種比較鮮為人知的技術,未來亦會完全改變我們的生活。 它就是腦機相關技術。
Thumbnail
人腦是自然界最神奇的創造之一。這個細小而複雜的器官擁有驚人的能力,使我們能夠思考、感知、記憶和創造。儘管科學家們已經在這個領域取得了長足的進展,但仍有許多關於人腦的奧秘等待我們去揭示。在本篇部落格中,我們將深入探討人腦的結構、功能以及其對我們的生活的重要性。
Thumbnail
人腦是自然界最神奇的創造之一。這個細小而複雜的器官擁有驚人的能力,使我們能夠思考、感知、記憶和創造。儘管科學家們已經在這個領域取得了長足的進展,但仍有許多關於人腦的奧秘等待我們去揭示。在本篇部落格中,我們將深入探討人腦的結構、功能以及其對我們的生活的重要性。
Thumbnail
感覺這個世紀,什麼東西都是要用電腦計算機來研究了。 心理活動是人腦對資訊進行算法的結果;認知升級,就是演算法升級。 我閱讀認知科學的過程,感受到它讓我用一種全新的角度,來看待「人的主觀世界」。 我們的心智是否就是一個從輸入到輸出的機器呢? 我們學習各種新知,是否就是在安裝演算法呢?
Thumbnail
感覺這個世紀,什麼東西都是要用電腦計算機來研究了。 心理活動是人腦對資訊進行算法的結果;認知升級,就是演算法升級。 我閱讀認知科學的過程,感受到它讓我用一種全新的角度,來看待「人的主觀世界」。 我們的心智是否就是一個從輸入到輸出的機器呢? 我們學習各種新知,是否就是在安裝演算法呢?
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News