AWS 上線 DeepSeek-R1 系列模型:企業生成式 AI 的新突破

更新 發佈閱讀 5 分鐘
AWS & DeepSeek

AWS & DeepSeek

近期,AWS 正式在 Amazon Bedrock Marketplace 與 Amazon SageMaker JumpStart 平台推出全新的 DeepSeek-R1 系列模型,為企業在生成式 AI 部署上帶來了更高的效能與成本優化方案。

企業級 AI 部署的新見解

在最近的 AWS re:Invent 大會上,Amazon 執行長 Andy Jassy 分享了亞馬遜內部應用近千項生成式 AI 解決方案的寶貴經驗。他強調,隨著生成式 AI 應用規模不斷擴大,三大關鍵因素必不可少:

  • 運算成本:隨著規模擴展,追求高性價比的運算資源變得尤為重要。
  • 技術難度:打造一個優質的生成式 AI 應用需要克服重重技術挑戰。
  • 模型多樣性:不同業務需求下,靈活選擇適合的模型至關重要,沒有一款單一模型能適應所有場景。

這些觀察不僅指引了 AWS 的產品策略,也為新模型的上線奠定了堅實基礎。

DeepSeek:中國 AI 初創的新力量

來自中國的 AI 初創公司 DeepSeek,自 2024 年底推出 DeepSeek-V3 以來,一直持續創新。2025 年初,DeepSeek 接連發布了 DeepSeek-R1 系列,包括擁有 6710 億參數的 DeepSeek-R1-Zero 以及多種規模的 DeepSeek-R1-Distill 模型。這些模型不僅在推理表現上突出,據悉在成本上也比市面上同類產品低 90-95%,為企業用戶提供了更具吸引力的選擇。

多重部署方案 靈活應對各類需求

AWS 為使用者提供了多種部署 DeepSeek-R1 模型的方式,滿足不同應用場景的需求:

  • Amazon Bedrock Marketplace
    使用者可透過統一的模型目錄輕鬆訂閱並部署 DeepSeek-R1 模型。平台支持自定義端點、配置安全設置及高級網路選項,同時內建 Guardrails 功能,可過濾不當輸入和輸出,確保應用安全穩定。
  • Amazon SageMaker JumpStart
    對於追求快速上手及高度自定義的企業,用戶可以通過 SageMaker Studio 或 API 方式迅速部署 DeepSeek-R1 模型。平台還結合了各種監控、調試工具,便於在生產環境中持續優化模型表現。
  • Amazon Bedrock Custom Model Import
    此方案允許企業上傳自定義的 DeepSeek-R1-Distill 模型,免除繁瑣的基礎架構管理,並享有 AWS 提供的企業級安全與彈性擴展能力。
  • AWS Trainium 與 Inferentia 加持的 Amazon EC2 部署
    對於追求極致性價比的應用場景,企業可以在搭載 AWS Trainium 或 Inferentia 處理器的 EC2 實例上運行 DeepSeek-R1-Distill 模型,透過專用深度學習 AMI 快速啟動大規模運算任務。

強化安全,驅動創新未來

無論是選用 Bedrock 或 SageMaker 平台,AWS 都將安全性與數據隱私作為首要考量。透過虛擬私有雲(VPC)配置和先進的 Guardrails 功能,用戶能夠在確保數據不外泄的前提下,安心進行生成式 AI 的實驗與部署。

結語

隨著 DeepSeek-R1 系列模型正式上線,AWS 為企業帶來了從模型選擇、部署到安全管理的一站式解決方案。這不僅降低了企業創新 AI 應用的門檻,更為業界未來的生成式 AI 應用提供了充足的技術支撐。企業用戶如今可以在美國東部與西部等主要區域,通過 AWS 平台探索這一全新技術,從而在數位轉型的浪潮中搶得先機。

資料來源: https://aws.amazon.com/tw/blogs/aws/deepseek-r1-models-now-available-on-aws/


🔥你還在等什麼? 立即追蹤我們🔥



🔗 立即量身打造最省錢的雲端解決方案!

Elite Cloud | 你最智慧、最靈活的雲端夥伴

留言
avatar-img
勤英科技的沙龍
0會員
30內容數
勤英科技 | 雲端成本優化,提供企業級雲端解決方案 勤英科技 Elite Cloud 為全球領先的雲端代理商,專注 AWS、GCP、Azure、阿里雲、騰訊雲 等雲端費用管理,提供 24/7 的技術支援,透過透明帳單管理,幫助企業降低支出、提升效能,確保雲端資源最佳化,加速業務成長。
勤英科技的沙龍的其他內容
2025/04/22
還在苦惱 S3 架的網站打開超慢?本篇教你如何用 AWS CloudFront 加速靜態網站,打造超快 CDN 架構,速度提升、安全加倍!
Thumbnail
2025/04/22
還在苦惱 S3 架的網站打開超慢?本篇教你如何用 AWS CloudFront 加速靜態網站,打造超快 CDN 架構,速度提升、安全加倍!
Thumbnail
2025/03/17
快速搜尋 GCP費用優化策略!本文解析主要計費模式與常見支出源,並提供实用管理工具和優化策略,助您降低雲端成本。
Thumbnail
2025/03/17
快速搜尋 GCP費用優化策略!本文解析主要計費模式與常見支出源,並提供实用管理工具和優化策略,助您降低雲端成本。
Thumbnail
2025/03/17
AWS 計費架構複雜,企業該如何降低雲端支出?本篇將解析 AWS 費用結構、提供 3 大優化策略,並介紹 Elite Cloud 的費用試算與多雲整合服務,幫助企業最大化成本效益!
Thumbnail
2025/03/17
AWS 計費架構複雜,企業該如何降低雲端支出?本篇將解析 AWS 費用結構、提供 3 大優化策略,並介紹 Elite Cloud 的費用試算與多雲整合服務,幫助企業最大化成本效益!
Thumbnail
看更多
你可能也想看
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型,並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing,現
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 我們已經在 AI說書 - 從0開始 - 114 建立了 Transformer 模型,並在 AI說書 - 從0開始 - 115 載入權重並執行 Tokenizing,現
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 75 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 76 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
今天來和你分享這本我剛讀完的「AI 世界的底層邏輯與生存法則」。當大家一股腦地想投入AI的領域當中時,這本書的作者程世嘉帶著我們用更高的視角和思維來思考,在AI時代下最重要的底層思考邏輯,找出那些最有價值的核心觀念,幫助我們在這個快速變化的世界當中站穩腳步,釐清未來的方向。
Thumbnail
今天來和你分享這本我剛讀完的「AI 世界的底層邏輯與生存法則」。當大家一股腦地想投入AI的領域當中時,這本書的作者程世嘉帶著我們用更高的視角和思維來思考,在AI時代下最重要的底層思考邏輯,找出那些最有價值的核心觀念,幫助我們在這個快速變化的世界當中站穩腳步,釐清未來的方向。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 77 ,我們在給定句子 「 Transformers possess surprising emerging features 」的情
Thumbnail
  這回來介紹 AWS 在目前生成式 AI 各種群魔亂舞下推出的 Bedrock 服務,其官網說明可以快速且傻瓜式的部屬生成式 AI 到你的應用上,看看是不是如其所述的功能強大。
Thumbnail
  這回來介紹 AWS 在目前生成式 AI 各種群魔亂舞下推出的 Bedrock 服務,其官網說明可以快速且傻瓜式的部屬生成式 AI 到你的應用上,看看是不是如其所述的功能強大。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News