模型伺服框架

2025/09/14 更新2025/09/14 發佈閱讀 2 分鐘

TensorFlow Serving 是 Google 推出的高性能模型服務系統，最初針對 TensorFlow 模型優化，但也支持擴展至其他模型，提供 gRPC 和 HTTP API，支持多版本模型管理和高效推理，適合生產環境。

TorchServe 是 PyTorch 官方的模型部署工具，自帶管理和推理 API，支持多模型註冊和批量推理，能方便地將 PyTorch 模型打包成 .mar 檔部署到服務中，支持 CPU/GPU 和多種雲端環境。

Nvidia Triton Inference Server 是 Nvidia 開源的推理服務器，支持多種深度學習框架（如 TensorRT、PyTorch、ONNX 等），並能在多種硬體（Nvidia GPU、CPU、ARM）上運行，強調高效能推理和多模型部署。

Seldon Core 是一個專為 Kubernetes 設計的機器學習模型服務架構，支持將多種主流 ML 框架模型容器化並作為微服務部署，支持服務治理、指標監控、追踪與擴展，方便複雜生產環境下的模型管理。

KServe（原 KFServing）是基於 Kubernetes 的機器學習模型推理平台，支援多框架，強調彈性擴展、無伺服器架構與高可用，具備自動擴縮、canary 發佈、模型管線等先進功能，適合規模化生產應用。

各系統比較：

簡言之，選擇時若專注TensorFlow，可以選 TensorFlow Serving；PyTorch生態則可考慮 TorchServe；追求跨框架效能和多硬體支持則 Nvidia Triton 是首選；如果基於 Kubernetes 架構進行大規模模型部署與管理，則 Seldon Core 和 KServe 是更適合的現代化解決方案.

含 AI 應用內容

郝信華 iPAS AI應用規劃師學習筆記AI技術系統集成與部署

留言

郝信華 iPAS AI應用規劃師學習筆記

44會員

572內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師初級+中級(數據分析) AWS AIF-C01 AWS CLF-C02 Microsoft AI-900 其他：富邦美術館志工

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/09/14

Grafana與Prometheus

Grafana與Prometheus常常搭配使用，構成強大的監控與可視化解決方案。 Prometheus簡介一個開源的分布式系統監控和告警工具，專門收集時序數據（metrics）。支援多種數據收集方式，尤其適合雲原生環境和容器監控。通過拉取（scrape）方式定期從被監控目標獲取數據，

2025/09/14

Grafana與Prometheus

2025/09/14

Evidently AI

Evidently AI 是一個開源的 Python 庫和平台，專門用於機器學習（ML）模型的評估、測試及監控，支持從實驗階段到生產環境的全生命周期管理。它能幫助數據科學家和ML工程師自動化地檢測數據漂移（Data Drift）、模型性能變化、數據質量問題等，從而保障ML系統的穩定和準確性。 Ev

2025/09/14

Evidently AI

2025/09/12

Kolmogorov-Smirnov檢定（簡稱K-S檢定）

Kolmogorov-Smirnov檢定（簡稱K-S檢定）是一種基於累積分布函數（CDF）的無母數統計檢定方法，用來比較兩個經驗分佈是否相同，或比較樣本分布是否與某個理論分布（如常態分布、均一分布）一致。 K-S檢定作為分佈距離度量 K-S統計量 $$ D $$ 即為兩分布之間的最大距離（最大垂

2025/09/12

Kolmogorov-Smirnov檢定（簡稱K-S檢定）

看更多

你可能也想看

螃蟹_crab的沙龍

[深度學習]訓練VAE模型用於生成圖片_生成篇

本文將延續上一篇文章，經由訓練好的VAE模型其中的解碼器，來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇輸入產生的隨機雜訊，輸入VAE的解碼器後，生成的圖片

#深度學習#VAE模型#生成圖片

2024/07/25

螃蟹_crab的沙龍

[深度學習]訓練VAE模型用於生成圖片_生成篇

#深度學習#VAE模型#生成圖片

2024/07/25

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

《轉轉生》（Re:INCARNATION）為奈及利亞編舞家庫德斯．奧尼奎庫與 Q 舞團創作的當代舞蹈作品，結合拉各斯街頭節奏、Afrobeat／Afrobeats、以及約魯巴宇宙觀的非線性時間，建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發，解析其去殖民的身體政治。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

詹育杰的沙龍

《轉轉生 Re:INCARNATION》：Qudus Onikeku、約魯巴哲學與 Afrobeat 的去殖民身體政治

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/05

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

背景：從冷門配角到市場主線，算力與電力被重新定價小P從2008進入股市，每一個時期的投資亮點都不同，記得2009蘋果手機剛上市，當時蘋果只要在媒體上提到哪一間供應鏈，隔天股價就有驚人的表現，當時光學鏡頭非常熱門，因為手機第一次搭上鏡頭可以拍照，也造就傳統相機廠的殞落，如今手機已經全面普及，題

#AI#算力#電力

2026/04/11

小P趨勢投資

算力的盡頭是電力！009819 小P量化交易者眼中的AI基建雙引擎致勝邏輯

#AI#算力#電力

2026/04/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

本文分析導演巴里・柯斯基（Barrie Kosky）如何運用極簡的舞臺配置，將布萊希特（Bertolt Brecht）的「疏離效果」轉化為視覺奇觀與黑色幽默，探討《三便士歌劇》在當代劇場中的新詮釋，並藉由舞臺、燈光、服裝、音樂等多方面，分析該作如何在保留批判核心的同時，觸及觀眾的觀看位置與人性幽微。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11

陳沅綦的沙龍

柏林劇團《三便士歌劇》：巴里．柯斯基的經典再造，與布萊希特劇場的當代轉向

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/11

Chih-Yuan Yip的沙龍

人工智慧開源庫 PyTorch 2.4 發布

PyTorch 是一個開源的 Python 機器學習庫，基於 Torch 庫，底層由 C++ 實現，應用於人工智慧領域，如電腦視覺和自然語言處理等。 PyTorch 2.4 引入了多項新功能和改進，包括支援 Python 3.12、AOTInductor 凍結功能、新的高階 Python 自訂運算

#PyTorch#Pytorch#pytorch

2024/08/09

Chih-Yuan Yip的沙龍

人工智慧開源庫 PyTorch 2.4 發布

#PyTorch#Pytorch#pytorch

2024/08/09

typedef struct 隨筆記{

wsl2中架設tensorflowGPU環境

牽涉到的工具:wsl2 + anaconda + jupyter-nootbook

#機器學習#tensorflow

2024/07/23

typedef struct 隨筆記{

wsl2中架設tensorflowGPU環境

牽涉到的工具:wsl2 + anaconda + jupyter-nootbook

#機器學習#tensorflow

2024/07/23

Karen的沙龍

【邁向圖神經網絡GNN】Part5: 建構 GNN model 實作 Cora 資料集結點分類任務

本篇文章介紹如何使用PyTorch構建和訓練圖神經網絡（GNN），並使用Cora資料集進行節點分類任務。通過模型架構的逐步優化，包括引入批量標準化和獨立的消息傳遞層，調整Dropout和聚合函數，顯著提高了模型的分類準確率。實驗結果表明，經過優化的GNN模型在處理圖結構數據具有強大的性能和應用潛力。

#GNN#Graph#dropout

2024/07/28