Meta發布Llama 4,分數超越Deepseek Claude 3.7等競爭對手

更新 發佈閱讀 1 分鐘
投資理財內容聲明

摘要

Meta 推出了 Llama 4 系列模型,包括 Llama 4 Scout 和 Llama 4 Maverick,這兩款開源多模態模型採用混合專家(MoE)架構,並在效能和成本效益上超越前代及競爭對手。Llama 4 Scout 擁有 170 億活躍參數和 10M 上下文窗口,適合單一 GPU 部署;Llama 4 Maverick 則在推理和編碼任務上表現優異,媲美更大規模的模型。此外,Meta 預覽了仍在訓練中的 Llama 4 Behemoth,這是一款 2880 億參數的頂級模型,專注於 STEM 領域的表現。這些模型強調開放創新,並整合了安全措施與偏見緩解技術。

關鍵點

  • Llama 4 Scout:170 億活躍參數、16 位專家,支援 10M 上下文窗口,適合單一 H100 GPU 部署,在多模態任務中表現卓越。
  • Llama 4 Maverick:170 億活躍參數、128 位專家,在推理、編碼和圖像理解上超越 GPT-4o 和 Gemini 2.0,成本效益高。
  • Llama 4 Behemoth:2880 億參數的教師模型,專注於 STEM 基準測試,未來將支援更小模型的蒸餾訓練。
  • 混合專家架構(MoE):僅激活部分參數,提升訓練和推理效率,同時保持模型效能。
  • 多模態整合:早期融合技術統一處理文本和視覺數據,增強跨模態理解能力。
  • 安全措施:包含預訓練數據過濾、系統級防護工具(如 Llama Guard),以及自動化紅隊測試(GOAT)。
  • 偏見改進:Llama 4 在政治和社會議題上的回應偏見顯著降低,拒絕回答的比例從 7% 降至 2%。


vocus|新世代的創作平台
vocus|新世代的創作平台
vocus|新世代的創作平台
vocus|新世代的創作平台
vocus|新世代的創作平台



留言
avatar-img
分析師的市場觀點
382會員
1.8K內容數
現職全台最大銀行擔任AI/科技股供應鏈投資分析師。 很高興能夠成為你實踐財富自由的第一步,歡迎瀏覽進階訂閱方案 原價每天不到5元,CP值最高,超越報紙資訊的法人投行分析。 精簡快速分享投行法人研究及操盤思維 希望能讓你我用最少時間、精力、資金洞察近期金融市場的變化與重點分享。
2025/04/30
摘要 該報告分析了Airtac(1590.TW)的財務表現與未來預測,重點包括2024年至2027年的營收與利潤增長、現金流與資本支出管理,以及環境、社會和治理(ESG)指標。報告指出,公司營收與EBITDA預計將持續增長,且自由現金流穩健,同時ESG指標顯示其在碳排放與治理結構上的進展。目標股價
Thumbnail
2025/04/30
摘要 該報告分析了Airtac(1590.TW)的財務表現與未來預測,重點包括2024年至2027年的營收與利潤增長、現金流與資本支出管理,以及環境、社會和治理(ESG)指標。報告指出,公司營收與EBITDA預計將持續增長,且自由現金流穩健,同時ESG指標顯示其在碳排放與治理結構上的進展。目標股價
Thumbnail
2025/04/30
摘要 台積電(TSMC)在2025年4月23日舉行的北美技術研討會中,分享了A14製程、先進封裝技術擴展路線圖及特殊製程等關鍵技術更新。儘管宏觀經濟不確定性存在,台積電憑藉半導體內容驅動的成長,尤其在AI與高效能運算(HPC)領域的強勁需求,使其在產業低迷期仍可能表現優異。報告重申對台積電的「買入
Thumbnail
2025/04/30
摘要 台積電(TSMC)在2025年4月23日舉行的北美技術研討會中,分享了A14製程、先進封裝技術擴展路線圖及特殊製程等關鍵技術更新。儘管宏觀經濟不確定性存在,台積電憑藉半導體內容驅動的成長,尤其在AI與高效能運算(HPC)領域的強勁需求,使其在產業低迷期仍可能表現優異。報告重申對台積電的「買入
Thumbnail
2025/04/30
摘要 摩根大通對台灣半導體設備製造商Kinik(1560.TW)持樂觀態度,認為其2025年第一季毛利率將優於預期,且長期展望穩健。報告指出,Kinik近期股價表現不佳已反映負面因素,如N2製程放緩與宏觀不確定性,但潛在催化劑包括第一季財報優於預期(受益於SBU利潤回升)及未來DBU客戶拓展。此外
Thumbnail
2025/04/30
摘要 摩根大通對台灣半導體設備製造商Kinik(1560.TW)持樂觀態度,認為其2025年第一季毛利率將優於預期,且長期展望穩健。報告指出,Kinik近期股價表現不佳已反映負面因素,如N2製程放緩與宏觀不確定性,但潛在催化劑包括第一季財報優於預期(受益於SBU利潤回升)及未來DBU客戶拓展。此外
Thumbnail
看更多
你可能也想看
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
在AI領域的競爭中,Meta再次展現了其不可忽視的實力。Mark Zuckerberg的公司最近發布了他們迄今為止最強大的大型語言模型 Llama 3.1,這不僅是免費的,而且還可以說是開源的。這一舉動無疑將在AI界掀起巨浪,但它真的能與OpenAI和Google等巨頭抗衡嗎?讓我們一起深入探討
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
在AI時代中,GPT技術正在改變我們的生活。然而,SLM(小型語言模型)也開始受到關注,具有更高的效率、更低的資源消耗和更快的響應速度。這篇文章將討論LLM和SLM的比較、SLM的應用場景以及未來的發展趨勢。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 繼 AI說書 - 從0開始 - 82 與 xxx ,我們談論了衡量 AI 模型的方式,那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時,需要
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 繼 AI說書 - 從0開始 - 82 與 xxx ,我們談論了衡量 AI 模型的方式,那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時,需要
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 新模型和 Human Baselines 排名將不斷變化,Human Baselines 的位置自從基礎模型出現以來,它就不再具有多大意義了,這些排名只是表明經典 NL
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 新模型和 Human Baselines 排名將不斷變化,Human Baselines 的位置自從基礎模型出現以來,它就不再具有多大意義了,這些排名只是表明經典 NL
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News