阿Han的沙龍

阿Han的軟體技術棧 💡

209免費公開
主軸圍繞於軟體科技, 除了過往經驗成章以外也持續學習新技能, 並將學習心法記錄與分享, 以期幫助相同道路之夥伴。 裡面包含著各種程式語言的疑難雜症解題技巧, 也提供資料庫、AI、認證與授權、工具庫...等技巧, 讓您自由找出您想要的解答, 如果您想要系統化的教學課程也歡迎至「🔒 阿Han的軟體心法實戰營」。
全部類型
免費與付費
最新發佈
最新發佈
avatar-avatar
阿Han
2025/10/02
在AI、機器學習的領域裡, 我們常常需要評估訓練模型的好與壞, 通常我們關注的是準確率, 其中還有兩個容易被搞混的名詞: • Precision(精確率) • Recall(召回率) 為了搞懂這些名詞, 我們將以2020年發生的Covid-19來舉例說明, 幫助需要的朋友快速理解兩者差異。
Thumbnail
avatar-avatar
阿Han
2025/10/02
在AI、機器學習的領域裡, 我們常常需要評估訓練模型的好與壞, 通常我們關注的是準確率, 其中還有兩個容易被搞混的名詞: • Precision(精確率) • Recall(召回率) 為了搞懂這些名詞, 我們將以2020年發生的Covid-19來舉例說明, 幫助需要的朋友快速理解兩者差異。
Thumbnail
avatar-avatar
阿Han
2025/09/25
✨ 前言 如果說 GPT 就像是一位聰明的助手,那 AutoGen 就是讓你能夠組建一個小型 AI 團隊,彼此協作完成任務的框架。 就像我們真實的世界裡一般, 這個時代不再是單打獨鬥的時代了, 而是組成一個團隊, 針對共同的問題去解決, 團隊中各個成員具備不同的能力與思維, 我們驅動者要學會如何
Thumbnail
avatar-avatar
阿Han
2025/09/25
✨ 前言 如果說 GPT 就像是一位聰明的助手,那 AutoGen 就是讓你能夠組建一個小型 AI 團隊,彼此協作完成任務的框架。 就像我們真實的世界裡一般, 這個時代不再是單打獨鬥的時代了, 而是組成一個團隊, 針對共同的問題去解決, 團隊中各個成員具備不同的能力與思維, 我們驅動者要學會如何
Thumbnail
avatar-avatar
阿Han
2025/09/18
你有沒有遇過這樣的情況:打開一份上百頁的 PDF 文件,只是為了找一個小小的答案,結果花了半小時還翻不到重點? 我常常在讀技術文件或研究資料時,都遇到這種麻煩,於是我開始想:能不能做一個「文件助理」,讓我可以直接問它問題,它會自動在文件裡找到相關內容,再用 AI 幫我整理答案? 就這樣,我設計並
Thumbnail
avatar-avatar
阿Han
2025/09/18
你有沒有遇過這樣的情況:打開一份上百頁的 PDF 文件,只是為了找一個小小的答案,結果花了半小時還翻不到重點? 我常常在讀技術文件或研究資料時,都遇到這種麻煩,於是我開始想:能不能做一個「文件助理」,讓我可以直接問它問題,它會自動在文件裡找到相關內容,再用 AI 幫我整理答案? 就這樣,我設計並
Thumbnail
avatar-avatar
阿Han
2025/07/02
🧵 一個小故事 在某個星期六的清晨,工程師小明被監控的訊息吵醒, Airflow 上的任務居然跑了 16 個小時還沒結束! 原來是某支資料轉換腳本卡在網路重連邏輯中,無限重試,一路跑進週末。 這時候小明邊泡咖啡邊想: 「要是早點加上 timeout,就不用週末加班了...」。 🧠 為什麼
Thumbnail
avatar-avatar
阿Han
2025/07/02
🧵 一個小故事 在某個星期六的清晨,工程師小明被監控的訊息吵醒, Airflow 上的任務居然跑了 16 個小時還沒結束! 原來是某支資料轉換腳本卡在網路重連邏輯中,無限重試,一路跑進週末。 這時候小明邊泡咖啡邊想: 「要是早點加上 timeout,就不用週末加班了...」。 🧠 為什麼
Thumbnail
avatar-avatar
阿Han
2025/06/18
Common Voice 是 Mozilla 發起的一個開源專案,目的是建立一個大型、公開、自由可用的語音資料庫,讓任何人(尤其是研究人員、開發者、公司)都可以用來訓練語音辨識、語音合成(TTS)等人工智慧應用。 很幸運的, Common Voice也將原始碼提供給大家使用, 在 🔍 h
Thumbnail
avatar-avatar
阿Han
2025/06/18
Common Voice 是 Mozilla 發起的一個開源專案,目的是建立一個大型、公開、自由可用的語音資料庫,讓任何人(尤其是研究人員、開發者、公司)都可以用來訓練語音辨識、語音合成(TTS)等人工智慧應用。 很幸運的, Common Voice也將原始碼提供給大家使用, 在 🔍 h
Thumbnail
avatar-avatar
阿Han
2025/06/11
關於Airflow是什麼, 歡迎參考「🔒 阿Han的軟體心法實戰營 - MLOps」, 在開始之前我們也推薦以下兩篇給您閱讀: 【🔒 MLOps - Airflow】使用docker compose架設Airflow 【🔒 MLOps - Airflow】使用DAG流程呼叫Docker O
Thumbnail
avatar-avatar
阿Han
2025/06/11
關於Airflow是什麼, 歡迎參考「🔒 阿Han的軟體心法實戰營 - MLOps」, 在開始之前我們也推薦以下兩篇給您閱讀: 【🔒 MLOps - Airflow】使用docker compose架設Airflow 【🔒 MLOps - Airflow】使用DAG流程呼叫Docker O
Thumbnail
avatar-avatar
阿Han
2025/05/14
當我們在開發AI應用程式的時候, 常常會使用到onnx, ONNX 是一種開放標準格式,允許不同深度學習框架(如 PyTorch、TensorFlow、Scikit-learn)之間互通,使模型可以在不同平台上運行,而 ONNX Runtime 則是一個高效能的推理引擎,專門用來加速 ONNX
Thumbnail
avatar-avatar
阿Han
2025/05/14
當我們在開發AI應用程式的時候, 常常會使用到onnx, ONNX 是一種開放標準格式,允許不同深度學習框架(如 PyTorch、TensorFlow、Scikit-learn)之間互通,使模型可以在不同平台上運行,而 ONNX Runtime 則是一個高效能的推理引擎,專門用來加速 ONNX
Thumbnail
avatar-avatar
阿Han
2025/04/30
我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」有分享如何使用Docker來架設GPT-SoVITS的TTS API服務, 但過程中我們卻遇到了一些困難, 相信有深入使用這套TTS服務的朋友應該難免也會遇到這類的問題, 期望透過我們的分享幫助到正在遇到困難的你! 首先我
Thumbnail
avatar-avatar
阿Han
2025/04/30
我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」有分享如何使用Docker來架設GPT-SoVITS的TTS API服務, 但過程中我們卻遇到了一些困難, 相信有深入使用這套TTS服務的朋友應該難免也會遇到這類的問題, 期望透過我們的分享幫助到正在遇到困難的你! 首先我
Thumbnail
avatar-avatar
阿Han
2025/04/23
我們在「【🤖 cursor AI】如何在ubuntu 24.04安裝」有分享如何在Ubuntu安裝cursro這套AI編輯器, 使用起來大幅度的提昇開發效率, 但仍有些問題點需要克服, 比如說: LLM壓根不知道我們的數據庫長怎樣啊? 怎麼分析結構呢? 假設文檔又不足的狀況下更是艱辛, 如果LLM
Thumbnail
avatar-avatar
阿Han
2025/04/23
我們在「【🤖 cursor AI】如何在ubuntu 24.04安裝」有分享如何在Ubuntu安裝cursro這套AI編輯器, 使用起來大幅度的提昇開發效率, 但仍有些問題點需要克服, 比如說: LLM壓根不知道我們的數據庫長怎樣啊? 怎麼分析結構呢? 假設文檔又不足的狀況下更是艱辛, 如果LLM
Thumbnail
avatar-avatar
阿Han
2025/03/12
我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」分享了語音合成技術, 該套GPT-SoVITS也非常的出色, 但效能有點不是非常理想, 加上需要GPU才能達到較佳的體驗, 如此一來成本就會有點高了, 因此我們找了另外一套MeloTTS, 這一套強調CPU推理非常的快!
Thumbnail
avatar-avatar
阿Han
2025/03/12
我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」分享了語音合成技術, 該套GPT-SoVITS也非常的出色, 但效能有點不是非常理想, 加上需要GPU才能達到較佳的體驗, 如此一來成本就會有點高了, 因此我們找了另外一套MeloTTS, 這一套強調CPU推理非常的快!
Thumbnail
avatar-avatar
阿Han
2025/03/05
我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」分享如何架設API V3版本的TTS服務, 但發音的部份似乎只有早期的API版本才使用到g2pw這類的技術, 因此我們可能會需要將API退回舊版, 在這裡我們也整理了早期版本api與api_v2的一些差異, 期望幫助到正在面臨選
Thumbnail
avatar-avatar
阿Han
2025/03/05
我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」分享如何架設API V3版本的TTS服務, 但發音的部份似乎只有早期的API版本才使用到g2pw這類的技術, 因此我們可能會需要將API退回舊版, 在這裡我們也整理了早期版本api與api_v2的一些差異, 期望幫助到正在面臨選
Thumbnail
avatar-avatar
阿Han
2025/02/12
精彩回顧 【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務 【語音合成技術 - GPT-SoVITS】如何架設API伺服器 以上是我們過往分享過關於 https://github.com/RVC-Boss/GPT-SoVITS 的分享文章, 這次我們要來試試fine
Thumbnail
avatar-avatar
阿Han
2025/02/12
精彩回顧 【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務 【語音合成技術 - GPT-SoVITS】如何架設API伺服器 以上是我們過往分享過關於 https://github.com/RVC-Boss/GPT-SoVITS 的分享文章, 這次我們要來試試fine
Thumbnail
avatar-avatar
阿Han
2025/02/05
建議閱讀 在開始之前, 建議您先閱讀以下篇章, 相信當您開始大量使用Airflow作業時, 難免會需要儲存空間的方案, 像是今天的主角minio就是其中之一, 而我們會建議您先閱讀相關篇章也是有道理的, 因為我們推薦的方法是盡量以容器化為導向來進行Airflow自動化流程的作業, 避免干擾到主機的
Thumbnail
avatar-avatar
阿Han
2025/02/05
建議閱讀 在開始之前, 建議您先閱讀以下篇章, 相信當您開始大量使用Airflow作業時, 難免會需要儲存空間的方案, 像是今天的主角minio就是其中之一, 而我們會建議您先閱讀相關篇章也是有道理的, 因為我們推薦的方法是盡量以容器化為導向來進行Airflow自動化流程的作業, 避免干擾到主機的
Thumbnail
avatar-avatar
阿Han
2025/01/22
我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」介紹過如何透過docker啟動webui版的TTS服務器, 但假設我們想自行開發一個TTS服務, 並整合到系統裡面, 通常會需要一個傳輸介面來溝通, 而API就是最簡易的溝通方式, 正巧 ****GPT-SoVITS **
Thumbnail
avatar-avatar
阿Han
2025/01/22
我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」介紹過如何透過docker啟動webui版的TTS服務器, 但假設我們想自行開發一個TTS服務, 並整合到系統裡面, 通常會需要一個傳輸介面來溝通, 而API就是最簡易的溝通方式, 正巧 ****GPT-SoVITS **
Thumbnail
avatar-avatar
阿Han
2024/12/25
今天要分享的主題是關於「語音合成技術 - TTS」一款好用的開源軟體, 名為「GPT-SoVITS」, 它具有以下的特點: 零樣本(Zero Shot): 只需要五秒鐘的語音樣本就能即時文字轉語音。 少量樣本(Few Shot): 只要1分鐘樣本就能提高語音相似度及真實感。 跨語言: 日語
Thumbnail
avatar-avatar
阿Han
2024/12/25
今天要分享的主題是關於「語音合成技術 - TTS」一款好用的開源軟體, 名為「GPT-SoVITS」, 它具有以下的特點: 零樣本(Zero Shot): 只需要五秒鐘的語音樣本就能即時文字轉語音。 少量樣本(Few Shot): 只要1分鐘樣本就能提高語音相似度及真實感。 跨語言: 日語
Thumbnail
avatar-avatar
阿Han
2024/11/06
當我們架設好Docker環境, 並撰寫一個DAG為Docker Operator的關卡時, 執行後竟然出現以下錯誤: raise AirflowException("Failed to establish connection to any given Docker hosts.") air
Thumbnail
avatar-avatar
阿Han
2024/11/06
當我們架設好Docker環境, 並撰寫一個DAG為Docker Operator的關卡時, 執行後竟然出現以下錯誤: raise AirflowException("Failed to establish connection to any given Docker hosts.") air
Thumbnail
avatar-avatar
阿Han
2024/10/02
當我們在訓練各種模型時, 難免會有許多實驗性的參數、產出的模型、不同的資料來源, 隨著版本迭代越來越多, 過了一段時間回頭看之後卻發現當初最好的某一個實驗參數到底是啥啊? 模型去了哪裡? 用的數據集是哪些? 我想上述這些問題都是模型訓練的過程難免會遇到的問題, 除非我們有一套管理的SOP, 比
Thumbnail
avatar-avatar
阿Han
2024/10/02
當我們在訓練各種模型時, 難免會有許多實驗性的參數、產出的模型、不同的資料來源, 隨著版本迭代越來越多, 過了一段時間回頭看之後卻發現當初最好的某一個實驗參數到底是啥啊? 模型去了哪裡? 用的數據集是哪些? 我想上述這些問題都是模型訓練的過程難免會遇到的問題, 除非我們有一套管理的SOP, 比
Thumbnail
avatar-avatar
阿Han
2024/08/14
我們在「【語音辨識引擎sherpa-onnx GPU下篇】讓您體驗更快的語音辨識功能」建置環境的過程中預到了這樣的錯誤訊息: RuntimeError: /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc: 1209
Thumbnail
avatar-avatar
阿Han
2024/08/14
我們在「【語音辨識引擎sherpa-onnx GPU下篇】讓您體驗更快的語音辨識功能」建置環境的過程中預到了這樣的錯誤訊息: RuntimeError: /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc: 1209
Thumbnail
avatar-avatar
阿Han
2023/08/22
前面幾個篇章已經大致上介紹了Hugging Face這個平台的一些基本概念了,既然我們都能夠在平台上找到各式各樣的模型,而且也能夠照著教學一步步的來下載並使用,但有沒有更簡單的方式呢? 比如說,我們專注在應用端上的開發,AI的推理就藉由平台進行呢? 答案肯定是有的,近期越來越多開源的平台也都開放這
Thumbnail
avatar-avatar
阿Han
2023/08/22
前面幾個篇章已經大致上介紹了Hugging Face這個平台的一些基本概念了,既然我們都能夠在平台上找到各式各樣的模型,而且也能夠照著教學一步步的來下載並使用,但有沒有更簡單的方式呢? 比如說,我們專注在應用端上的開發,AI的推理就藉由平台進行呢? 答案肯定是有的,近期越來越多開源的平台也都開放這
Thumbnail
avatar-avatar
阿Han
2023/07/31
我們過往介紹了幾個關於文字AI應用的篇章: 【Hugging Face】Ep.5 文字世界中的超能力語言英雄(Named Entity Recognition) 【Hugging Face】Ep.6 解決問題的專業級破關知識家(Question Answering) 但單獨的文字應用似乎不太能
Thumbnail
avatar-avatar
阿Han
2023/07/31
我們過往介紹了幾個關於文字AI應用的篇章: 【Hugging Face】Ep.5 文字世界中的超能力語言英雄(Named Entity Recognition) 【Hugging Face】Ep.6 解決問題的專業級破關知識家(Question Answering) 但單獨的文字應用似乎不太能
Thumbnail
全部類型
免費與付費
最新發佈
最新發佈
avatar-avatar
阿Han
2025/10/02
在AI、機器學習的領域裡, 我們常常需要評估訓練模型的好與壞, 通常我們關注的是準確率, 其中還有兩個容易被搞混的名詞: • Precision(精確率) • Recall(召回率) 為了搞懂這些名詞, 我們將以2020年發生的Covid-19來舉例說明, 幫助需要的朋友快速理解兩者差異。
Thumbnail
avatar-avatar
阿Han
2025/10/02
在AI、機器學習的領域裡, 我們常常需要評估訓練模型的好與壞, 通常我們關注的是準確率, 其中還有兩個容易被搞混的名詞: • Precision(精確率) • Recall(召回率) 為了搞懂這些名詞, 我們將以2020年發生的Covid-19來舉例說明, 幫助需要的朋友快速理解兩者差異。
Thumbnail
avatar-avatar
阿Han
2025/09/25
✨ 前言 如果說 GPT 就像是一位聰明的助手,那 AutoGen 就是讓你能夠組建一個小型 AI 團隊,彼此協作完成任務的框架。 就像我們真實的世界裡一般, 這個時代不再是單打獨鬥的時代了, 而是組成一個團隊, 針對共同的問題去解決, 團隊中各個成員具備不同的能力與思維, 我們驅動者要學會如何
Thumbnail
avatar-avatar
阿Han
2025/09/25
✨ 前言 如果說 GPT 就像是一位聰明的助手,那 AutoGen 就是讓你能夠組建一個小型 AI 團隊,彼此協作完成任務的框架。 就像我們真實的世界裡一般, 這個時代不再是單打獨鬥的時代了, 而是組成一個團隊, 針對共同的問題去解決, 團隊中各個成員具備不同的能力與思維, 我們驅動者要學會如何
Thumbnail
avatar-avatar
阿Han
2025/09/18
你有沒有遇過這樣的情況:打開一份上百頁的 PDF 文件,只是為了找一個小小的答案,結果花了半小時還翻不到重點? 我常常在讀技術文件或研究資料時,都遇到這種麻煩,於是我開始想:能不能做一個「文件助理」,讓我可以直接問它問題,它會自動在文件裡找到相關內容,再用 AI 幫我整理答案? 就這樣,我設計並
Thumbnail
avatar-avatar
阿Han
2025/09/18
你有沒有遇過這樣的情況:打開一份上百頁的 PDF 文件,只是為了找一個小小的答案,結果花了半小時還翻不到重點? 我常常在讀技術文件或研究資料時,都遇到這種麻煩,於是我開始想:能不能做一個「文件助理」,讓我可以直接問它問題,它會自動在文件裡找到相關內容,再用 AI 幫我整理答案? 就這樣,我設計並
Thumbnail
avatar-avatar
阿Han
2025/07/02
🧵 一個小故事 在某個星期六的清晨,工程師小明被監控的訊息吵醒, Airflow 上的任務居然跑了 16 個小時還沒結束! 原來是某支資料轉換腳本卡在網路重連邏輯中,無限重試,一路跑進週末。 這時候小明邊泡咖啡邊想: 「要是早點加上 timeout,就不用週末加班了...」。 🧠 為什麼
Thumbnail
avatar-avatar
阿Han
2025/07/02
🧵 一個小故事 在某個星期六的清晨,工程師小明被監控的訊息吵醒, Airflow 上的任務居然跑了 16 個小時還沒結束! 原來是某支資料轉換腳本卡在網路重連邏輯中,無限重試,一路跑進週末。 這時候小明邊泡咖啡邊想: 「要是早點加上 timeout,就不用週末加班了...」。 🧠 為什麼
Thumbnail
avatar-avatar
阿Han
2025/06/18
Common Voice 是 Mozilla 發起的一個開源專案,目的是建立一個大型、公開、自由可用的語音資料庫,讓任何人(尤其是研究人員、開發者、公司)都可以用來訓練語音辨識、語音合成(TTS)等人工智慧應用。 很幸運的, Common Voice也將原始碼提供給大家使用, 在 🔍 h
Thumbnail
avatar-avatar
阿Han
2025/06/18
Common Voice 是 Mozilla 發起的一個開源專案,目的是建立一個大型、公開、自由可用的語音資料庫,讓任何人(尤其是研究人員、開發者、公司)都可以用來訓練語音辨識、語音合成(TTS)等人工智慧應用。 很幸運的, Common Voice也將原始碼提供給大家使用, 在 🔍 h
Thumbnail
avatar-avatar
阿Han
2025/06/11
關於Airflow是什麼, 歡迎參考「🔒 阿Han的軟體心法實戰營 - MLOps」, 在開始之前我們也推薦以下兩篇給您閱讀: 【🔒 MLOps - Airflow】使用docker compose架設Airflow 【🔒 MLOps - Airflow】使用DAG流程呼叫Docker O
Thumbnail
avatar-avatar
阿Han
2025/06/11
關於Airflow是什麼, 歡迎參考「🔒 阿Han的軟體心法實戰營 - MLOps」, 在開始之前我們也推薦以下兩篇給您閱讀: 【🔒 MLOps - Airflow】使用docker compose架設Airflow 【🔒 MLOps - Airflow】使用DAG流程呼叫Docker O
Thumbnail
avatar-avatar
阿Han
2025/05/14
當我們在開發AI應用程式的時候, 常常會使用到onnx, ONNX 是一種開放標準格式,允許不同深度學習框架(如 PyTorch、TensorFlow、Scikit-learn)之間互通,使模型可以在不同平台上運行,而 ONNX Runtime 則是一個高效能的推理引擎,專門用來加速 ONNX
Thumbnail
avatar-avatar
阿Han
2025/05/14
當我們在開發AI應用程式的時候, 常常會使用到onnx, ONNX 是一種開放標準格式,允許不同深度學習框架(如 PyTorch、TensorFlow、Scikit-learn)之間互通,使模型可以在不同平台上運行,而 ONNX Runtime 則是一個高效能的推理引擎,專門用來加速 ONNX
Thumbnail
avatar-avatar
阿Han
2025/04/30
我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」有分享如何使用Docker來架設GPT-SoVITS的TTS API服務, 但過程中我們卻遇到了一些困難, 相信有深入使用這套TTS服務的朋友應該難免也會遇到這類的問題, 期望透過我們的分享幫助到正在遇到困難的你! 首先我
Thumbnail
avatar-avatar
阿Han
2025/04/30
我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」有分享如何使用Docker來架設GPT-SoVITS的TTS API服務, 但過程中我們卻遇到了一些困難, 相信有深入使用這套TTS服務的朋友應該難免也會遇到這類的問題, 期望透過我們的分享幫助到正在遇到困難的你! 首先我
Thumbnail
avatar-avatar
阿Han
2025/04/23
我們在「【🤖 cursor AI】如何在ubuntu 24.04安裝」有分享如何在Ubuntu安裝cursro這套AI編輯器, 使用起來大幅度的提昇開發效率, 但仍有些問題點需要克服, 比如說: LLM壓根不知道我們的數據庫長怎樣啊? 怎麼分析結構呢? 假設文檔又不足的狀況下更是艱辛, 如果LLM
Thumbnail
avatar-avatar
阿Han
2025/04/23
我們在「【🤖 cursor AI】如何在ubuntu 24.04安裝」有分享如何在Ubuntu安裝cursro這套AI編輯器, 使用起來大幅度的提昇開發效率, 但仍有些問題點需要克服, 比如說: LLM壓根不知道我們的數據庫長怎樣啊? 怎麼分析結構呢? 假設文檔又不足的狀況下更是艱辛, 如果LLM
Thumbnail
avatar-avatar
阿Han
2025/03/12
我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」分享了語音合成技術, 該套GPT-SoVITS也非常的出色, 但效能有點不是非常理想, 加上需要GPU才能達到較佳的體驗, 如此一來成本就會有點高了, 因此我們找了另外一套MeloTTS, 這一套強調CPU推理非常的快!
Thumbnail
avatar-avatar
阿Han
2025/03/12
我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」分享了語音合成技術, 該套GPT-SoVITS也非常的出色, 但效能有點不是非常理想, 加上需要GPU才能達到較佳的體驗, 如此一來成本就會有點高了, 因此我們找了另外一套MeloTTS, 這一套強調CPU推理非常的快!
Thumbnail
avatar-avatar
阿Han
2025/03/05
我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」分享如何架設API V3版本的TTS服務, 但發音的部份似乎只有早期的API版本才使用到g2pw這類的技術, 因此我們可能會需要將API退回舊版, 在這裡我們也整理了早期版本api與api_v2的一些差異, 期望幫助到正在面臨選
Thumbnail
avatar-avatar
阿Han
2025/03/05
我們在「【語音合成技術 - GPT-SoVITS】如何架設API伺服器」分享如何架設API V3版本的TTS服務, 但發音的部份似乎只有早期的API版本才使用到g2pw這類的技術, 因此我們可能會需要將API退回舊版, 在這裡我們也整理了早期版本api與api_v2的一些差異, 期望幫助到正在面臨選
Thumbnail
avatar-avatar
阿Han
2025/02/12
精彩回顧 【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務 【語音合成技術 - GPT-SoVITS】如何架設API伺服器 以上是我們過往分享過關於 https://github.com/RVC-Boss/GPT-SoVITS 的分享文章, 這次我們要來試試fine
Thumbnail
avatar-avatar
阿Han
2025/02/12
精彩回顧 【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務 【語音合成技術 - GPT-SoVITS】如何架設API伺服器 以上是我們過往分享過關於 https://github.com/RVC-Boss/GPT-SoVITS 的分享文章, 這次我們要來試試fine
Thumbnail
avatar-avatar
阿Han
2025/02/05
建議閱讀 在開始之前, 建議您先閱讀以下篇章, 相信當您開始大量使用Airflow作業時, 難免會需要儲存空間的方案, 像是今天的主角minio就是其中之一, 而我們會建議您先閱讀相關篇章也是有道理的, 因為我們推薦的方法是盡量以容器化為導向來進行Airflow自動化流程的作業, 避免干擾到主機的
Thumbnail
avatar-avatar
阿Han
2025/02/05
建議閱讀 在開始之前, 建議您先閱讀以下篇章, 相信當您開始大量使用Airflow作業時, 難免會需要儲存空間的方案, 像是今天的主角minio就是其中之一, 而我們會建議您先閱讀相關篇章也是有道理的, 因為我們推薦的方法是盡量以容器化為導向來進行Airflow自動化流程的作業, 避免干擾到主機的
Thumbnail
avatar-avatar
阿Han
2025/01/22
我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」介紹過如何透過docker啟動webui版的TTS服務器, 但假設我們想自行開發一個TTS服務, 並整合到系統裡面, 通常會需要一個傳輸介面來溝通, 而API就是最簡易的溝通方式, 正巧 ****GPT-SoVITS **
Thumbnail
avatar-avatar
阿Han
2025/01/22
我們在「【語音合成技術 - GPT-SoVITS】讓機器說人話的語音生成服務」介紹過如何透過docker啟動webui版的TTS服務器, 但假設我們想自行開發一個TTS服務, 並整合到系統裡面, 通常會需要一個傳輸介面來溝通, 而API就是最簡易的溝通方式, 正巧 ****GPT-SoVITS **
Thumbnail
avatar-avatar
阿Han
2024/12/25
今天要分享的主題是關於「語音合成技術 - TTS」一款好用的開源軟體, 名為「GPT-SoVITS」, 它具有以下的特點: 零樣本(Zero Shot): 只需要五秒鐘的語音樣本就能即時文字轉語音。 少量樣本(Few Shot): 只要1分鐘樣本就能提高語音相似度及真實感。 跨語言: 日語
Thumbnail
avatar-avatar
阿Han
2024/12/25
今天要分享的主題是關於「語音合成技術 - TTS」一款好用的開源軟體, 名為「GPT-SoVITS」, 它具有以下的特點: 零樣本(Zero Shot): 只需要五秒鐘的語音樣本就能即時文字轉語音。 少量樣本(Few Shot): 只要1分鐘樣本就能提高語音相似度及真實感。 跨語言: 日語
Thumbnail
avatar-avatar
阿Han
2024/11/06
當我們架設好Docker環境, 並撰寫一個DAG為Docker Operator的關卡時, 執行後竟然出現以下錯誤: raise AirflowException("Failed to establish connection to any given Docker hosts.") air
Thumbnail
avatar-avatar
阿Han
2024/11/06
當我們架設好Docker環境, 並撰寫一個DAG為Docker Operator的關卡時, 執行後竟然出現以下錯誤: raise AirflowException("Failed to establish connection to any given Docker hosts.") air
Thumbnail
avatar-avatar
阿Han
2024/10/02
當我們在訓練各種模型時, 難免會有許多實驗性的參數、產出的模型、不同的資料來源, 隨著版本迭代越來越多, 過了一段時間回頭看之後卻發現當初最好的某一個實驗參數到底是啥啊? 模型去了哪裡? 用的數據集是哪些? 我想上述這些問題都是模型訓練的過程難免會遇到的問題, 除非我們有一套管理的SOP, 比
Thumbnail
avatar-avatar
阿Han
2024/10/02
當我們在訓練各種模型時, 難免會有許多實驗性的參數、產出的模型、不同的資料來源, 隨著版本迭代越來越多, 過了一段時間回頭看之後卻發現當初最好的某一個實驗參數到底是啥啊? 模型去了哪裡? 用的數據集是哪些? 我想上述這些問題都是模型訓練的過程難免會遇到的問題, 除非我們有一套管理的SOP, 比
Thumbnail
avatar-avatar
阿Han
2024/08/14
我們在「【語音辨識引擎sherpa-onnx GPU下篇】讓您體驗更快的語音辨識功能」建置環境的過程中預到了這樣的錯誤訊息: RuntimeError: /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc: 1209
Thumbnail
avatar-avatar
阿Han
2024/08/14
我們在「【語音辨識引擎sherpa-onnx GPU下篇】讓您體驗更快的語音辨識功能」建置環境的過程中預到了這樣的錯誤訊息: RuntimeError: /onnxruntime_src/onnxruntime/core/session/provider_bridge_ort.cc: 1209
Thumbnail
avatar-avatar
阿Han
2023/08/22
前面幾個篇章已經大致上介紹了Hugging Face這個平台的一些基本概念了,既然我們都能夠在平台上找到各式各樣的模型,而且也能夠照著教學一步步的來下載並使用,但有沒有更簡單的方式呢? 比如說,我們專注在應用端上的開發,AI的推理就藉由平台進行呢? 答案肯定是有的,近期越來越多開源的平台也都開放這
Thumbnail
avatar-avatar
阿Han
2023/08/22
前面幾個篇章已經大致上介紹了Hugging Face這個平台的一些基本概念了,既然我們都能夠在平台上找到各式各樣的模型,而且也能夠照著教學一步步的來下載並使用,但有沒有更簡單的方式呢? 比如說,我們專注在應用端上的開發,AI的推理就藉由平台進行呢? 答案肯定是有的,近期越來越多開源的平台也都開放這
Thumbnail
avatar-avatar
阿Han
2023/07/31
我們過往介紹了幾個關於文字AI應用的篇章: 【Hugging Face】Ep.5 文字世界中的超能力語言英雄(Named Entity Recognition) 【Hugging Face】Ep.6 解決問題的專業級破關知識家(Question Answering) 但單獨的文字應用似乎不太能
Thumbnail
avatar-avatar
阿Han
2023/07/31
我們過往介紹了幾個關於文字AI應用的篇章: 【Hugging Face】Ep.5 文字世界中的超能力語言英雄(Named Entity Recognition) 【Hugging Face】Ep.6 解決問題的專業級破關知識家(Question Answering) 但單獨的文字應用似乎不太能
Thumbnail