模型伺服框架

更新 發佈閱讀 2 分鐘

TensorFlow Serving 是 Google 推出的高性能模型服務系統,最初針對 TensorFlow 模型優化,但也支持擴展至其他模型,提供 gRPC 和 HTTP API,支持多版本模型管理和高效推理,適合生產環境。

TorchServe 是 PyTorch 官方的模型部署工具,自帶管理和推理 API,支持多模型註冊和批量推理,能方便地將 PyTorch 模型打包成 .mar 檔部署到服務中,支持 CPU/GPU 和多種雲端環境。

Nvidia Triton Inference Server 是 Nvidia 開源的推理服務器,支持多種深度學習框架(如 TensorRT、PyTorch、ONNX 等),並能在多種硬體(Nvidia GPU、CPU、ARM)上運行,強調高效能推理和多模型部署。

Seldon Core 是一個專為 Kubernetes 設計的機器學習模型服務架構,支持將多種主流 ML 框架模型容器化並作為微服務部署,支持服務治理、指標監控、追踪與擴展,方便複雜生產環境下的模型管理。

KServe(原 KFServing)是基於 Kubernetes 的機器學習模型推理平台,支援多框架,強調彈性擴展、無伺服器架構與高可用,具備自動擴縮、canary 發佈、模型管線等先進功能,適合規模化生產應用。

各系統比較:

vocus|新世代的創作平台

簡言之,選擇時若專注TensorFlow,可以選 TensorFlow Serving;PyTorch生態則可考慮 TorchServe;追求跨框架效能和多硬體支持則 Nvidia Triton 是首選;如果基於 Kubernetes 架構進行大規模模型部署與管理,則 Seldon Core 和 KServe 是更適合的現代化解決方案.

留言
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
44會員
572內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 初級+中級(數據分析) AWS AIF-C01 AWS CLF-C02 Microsoft AI-900 其他:富邦美術館志工
2025/09/14
Grafana與Prometheus常常搭配使用,構成強大的監控與可視化解決方案。 Prometheus簡介 一個開源的分布式系統監控和告警工具,專門收集時序數據(metrics)。 支援多種數據收集方式,尤其適合雲原生環境和容器監控。 通過拉取(scrape)方式定期從被監控目標獲取數據,
2025/09/14
Grafana與Prometheus常常搭配使用,構成強大的監控與可視化解決方案。 Prometheus簡介 一個開源的分布式系統監控和告警工具,專門收集時序數據(metrics)。 支援多種數據收集方式,尤其適合雲原生環境和容器監控。 通過拉取(scrape)方式定期從被監控目標獲取數據,
2025/09/14
Evidently AI 是一個開源的 Python 庫和平台,專門用於機器學習(ML)模型的評估、測試及監控,支持從實驗階段到生產環境的全生命周期管理。它能幫助數據科學家和ML工程師自動化地檢測數據漂移(Data Drift)、模型性能變化、數據質量問題等,從而保障ML系統的穩定和準確性。 Ev
2025/09/14
Evidently AI 是一個開源的 Python 庫和平台,專門用於機器學習(ML)模型的評估、測試及監控,支持從實驗階段到生產環境的全生命周期管理。它能幫助數據科學家和ML工程師自動化地檢測數據漂移(Data Drift)、模型性能變化、數據質量問題等,從而保障ML系統的穩定和準確性。 Ev
2025/09/12
Kolmogorov-Smirnov檢定(簡稱K-S檢定)是一種基於累積分布函數(CDF)的無母數統計檢定方法,用來比較兩個經驗分佈是否相同,或比較樣本分布是否與某個理論分布(如常態分布、均一分布)一致。 K-S檢定作為分佈距離度量 K-S統計量 $$ D $$ 即為兩分布之間的最大距離(最大垂
2025/09/12
Kolmogorov-Smirnov檢定(簡稱K-S檢定)是一種基於累積分布函數(CDF)的無母數統計檢定方法,用來比較兩個經驗分佈是否相同,或比較樣本分布是否與某個理論分布(如常態分布、均一分布)一致。 K-S檢定作為分佈距離度量 K-S統計量 $$ D $$ 即為兩分布之間的最大距離(最大垂
看更多
你可能也想看
Thumbnail
本文將延續上一篇文章,經由訓練好的VAE模型其中的解碼器,來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇 輸入產生的隨機雜訊,輸入VAE的解碼器後,生成的圖片
Thumbnail
本文將延續上一篇文章,經由訓練好的VAE模型其中的解碼器,來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇 輸入產生的隨機雜訊,輸入VAE的解碼器後,生成的圖片
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
PyTorch 是一個開源的 Python 機器學習庫,基於 Torch 庫,底層由 C++ 實現,應用於人工智慧領域,如電腦視覺和自然語言處理等。 PyTorch 2.4 引入了多項新功能和改進,包括支援 Python 3.12、AOTInductor 凍結功能、新的高階 Python 自訂運算
Thumbnail
PyTorch 是一個開源的 Python 機器學習庫,基於 Torch 庫,底層由 C++ 實現,應用於人工智慧領域,如電腦視覺和自然語言處理等。 PyTorch 2.4 引入了多項新功能和改進,包括支援 Python 3.12、AOTInductor 凍結功能、新的高階 Python 自訂運算
Thumbnail
牽涉到的工具:wsl2 + anaconda + jupyter-nootbook
Thumbnail
牽涉到的工具:wsl2 + anaconda + jupyter-nootbook
Thumbnail
本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡(GNN),並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化,包括引入批量標準化和獨立的消息傳遞層,調整Dropout和聚合函數,顯著提高了模型的分類準確率。實驗結果表明,經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。
Thumbnail
本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡(GNN),並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化,包括引入批量標準化和獨立的消息傳遞層,調整Dropout和聚合函數,顯著提高了模型的分類準確率。實驗結果表明,經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。
Thumbnail
透過這篇文章,我們將瞭解如何使用PyTorch實作圖神經網絡中的訊息傳遞機制,從定義消息傳遞的類別到實作消息傳遞過程。我們也探討了各種不同的消息傳遞機制,並通過對單次和多次傳遞過程的結果,可以看到節點特徵如何逐步傳遞與更新。
Thumbnail
透過這篇文章,我們將瞭解如何使用PyTorch實作圖神經網絡中的訊息傳遞機制,從定義消息傳遞的類別到實作消息傳遞過程。我們也探討了各種不同的消息傳遞機制,並通過對單次和多次傳遞過程的結果,可以看到節點特徵如何逐步傳遞與更新。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
本文將延續上一篇文章,經由訓練好的GAN模型中的生成器來生成圖片 [深度學習][Python]訓練MLP的GAN模型來生成圖片_訓練篇 [深度學習][Python]訓練CNN的GAN模型來生成圖片_訓練篇 相較之下CNN的GAN生成的效果比較好,但模型也相對比較複雜,訓練時間花的也比較
Thumbnail
當我們在開發一個AI應用服務時, 常常會需要載入大模型, But… 我們總不可能每一次的請求就載入一次模型吧! 這樣太沒有效率了, 也非常的浪費資源, 因此我們通常會希望應用程式啟動時就能夠載入模型, 之後每一次的請求只要讓模型進行運算即可, 那麼在FastAPI的框架中究竟要如何使用呢? 首
Thumbnail
當我們在開發一個AI應用服務時, 常常會需要載入大模型, But… 我們總不可能每一次的請求就載入一次模型吧! 這樣太沒有效率了, 也非常的浪費資源, 因此我們通常會希望應用程式啟動時就能夠載入模型, 之後每一次的請求只要讓模型進行運算即可, 那麼在FastAPI的框架中究竟要如何使用呢? 首
Thumbnail
本文主要介紹,如何利用GAN生成對抗網路來訓練生成圖片。 利用tensorflow,中的keras來建立生成器及鑑別器互相競爭訓練,最後利用訓練好的生成器來生成圖片。 GAN生成對抗網路的介紹 它由生成網路(Generator Network)和鑑別網路(Discriminator Netwo
Thumbnail
本文主要介紹,如何利用GAN生成對抗網路來訓練生成圖片。 利用tensorflow,中的keras來建立生成器及鑑別器互相競爭訓練,最後利用訓練好的生成器來生成圖片。 GAN生成對抗網路的介紹 它由生成網路(Generator Network)和鑑別網路(Discriminator Netwo
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News