🎤 Python 語音辨識教學：從語音轉文字快速入門

Pochi

發佈於簡單易懂的Python學習筆記

2026/03/19 更新2023/04/29 發佈閱讀 2 分鐘

隨著語音技術越來越成熟，我們可以很輕鬆地在程式中實現：

👉 語音轉文字（Speech-to-Text）

👉 語音助理 👉 語音控制工具

這篇帶你用 Python 快速做出一個「語音辨識」小範例。

Growtika null on Unsplash

🧩 安裝套件

先安裝必要套件：

pip install SpeechRecognitionpip install PyAudiopip install pyttsx3

⚠️ PyAudio 安裝注意（很多人會卡）

如果你在 Windows 安裝失敗，可以試試：

👉 下載對應版本的 .whl 檔手動安裝

👉 或使用：

pip install pipwinpipwin install pyaudio

🧩 匯入套件

import speech_recognition as srimport pyttsx3

🚀 基本範例：語音轉文字

import speech_recognition as srimport pyttsx3# 初始化語音引擎（文字轉語音）engine = pyttsx3.init()# 建立語音辨識器recognizer = sr.Recognizer()# 使用麥克風with sr.Microphone() as source:    print("請開始說話...")    audio = recognizer.listen(source)# 語音轉文字try:    text = recognizer.recognize_google(audio, language='zh-TW')    print("你說的是：" + text)except sr.UnknownValueError:    print("語音無法辨識")    text = ""except sr.RequestError as e:    print(f"連線錯誤：{e}")    text = ""

🔍 程式重點說明

🔹 Recognizer（語音辨識器）

recognizer = sr.Recognizer()

👉 負責處理聲音資料並轉成文字

🔹 Microphone（麥克風來源）

with sr.Microphone() as source:

👉 取得即時語音輸入

🔹 recognize_google（語音辨識）

recognizer.recognize_google(audio, language='zh-TW')

👉 使用 Google API 做辨識

👉 支援中文（台灣）

🧠 進階優化（很實用）

🔹 1. 降低環境雜音影響

with sr.Microphone() as source:    recognizer.adjust_for_ambient_noise(source)    print("請開始說話...")    audio = recognizer.listen(source)

🔹 2. 加入說話回應（文字轉語音）

engine.say("我聽到了")engine.runAndWait()

🔹 3. 限制錄音時間

audio = recognizer.listen(source, timeout=5, phrase_time_limit=5)

⚠️ 常見問題

❌ 語音辨識失敗

👉 原因可能是：

環境太吵
麥克風品質不好
語音太短或太快

❌ 無法連線

👉 recognize_google 需要網路

🚀 應用場景

你可以把這套用在：

🔹 語音助理（像簡易版 Siri）
🔹 語音控制電腦
🔹 遊戲語音操作
🔹 無障礙應用

✨ 結語

透過 Python，你可以很輕鬆做到：

✔ 語音輸入

✔ 語音轉文字 ✔ 語音互動

這也是打造 AI 工具很重要的一步。

留言

程式輕鬆玩

82會員

203內容數

這裡將以輕鬆風格，深入探討程式設計的基礎和高級概念。從程式語言到演算法，我們將以易懂的方式解釋每個主題，讓你輕鬆掌握。無論你是初學者或有經驗者，都能在這裡找到適合你的內容。無論你的目標是成為專業開發者還是擴展知識，我們都會陪伴你一同成長！

程式輕鬆玩的其他內容

2025/04/20

AI新紀元與晶片風雲：本週五大科技風暴

本週科技圈掀起多項重磅消息：OpenAI於4月14日釋出GPT‑4.1系列模型，進一步強化編碼與長文理解能力 Reuters；Chipolo推出POP藍牙追蹤器，同時支援Apple與Google尋找網路 The Verge；南韓新創RLWRLD完成1,480萬美元募資，將打造專屬機器人基礎模型

2025/04/20

AI新紀元與晶片風雲：本週五大科技風暴

2025/04/20

本週遊戲搶先看：經典25年回歸、星戰版 XCOM、荒誕粉紅大戰、Game Pass 下架清單與 Steam 獨立新星

本週遊戲動態涵蓋經典 25 週年重返 PC 平台、回合制策略新作重燃星戰熱潮、Remedy 荒誕合擊新作搶先曝光、Game Pass 下架名單震撼登場，以及 Steam 獨立新秀推薦不容錯過 PC GamerWindows Central。

2025/04/20

本週遊戲搶先看：經典25年回歸、星戰版 XCOM、荒誕粉紅大戰、Game Pass 下架清單與 Steam 獨立新星

2025/04/08

恐慌中求生存！川普32%關稅風暴下台股大挫，投資人如何逆勢翻盤？

近來因為川普政府啟動全新一輪對等關稅政策，全球貿易風暴席捲而來，而台灣面臨的衝擊更是不容小覷。美方以台灣過去對美出口關稅達64%為依據，採取「對等關稅」原則回敬徵收32%關稅，這一舉措不僅使得國際市場恐慌連連，台股也出現劇烈下跌，吸引了各界關注。

2025/04/08

恐慌中求生存！川普32%關稅風暴下台股大挫，投資人如何逆勢翻盤？

看更多

你可能也想看

釀電影，啜一口電影的美好。

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼，反而利用華麗的秀場視覺，引導觀眾在晚期資本主義的消費愉悅之中，而能驚覺「批判」本身亦可能被收編——而當絞繩升起，這場關於如何生存的黑色遊戲，又將帶領新時代的我們走向何種後現代的自我解構？

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

釀電影，啜一口電影的美好。

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

多語自學者

【AI＋語言學習】跟 ChatGPT 練習對話｜實用免費外掛工具＆擴增功能 Voice Control for Chat

調校電腦系統軟硬體，開啟 ChatGPT 的語音外掛，擴增 ChatGPT 的語音功能，升級進化 AI !!!

#語言學習#AI#ChatGPT

2023/06/08

多語自學者

【AI＋語言學習】跟 ChatGPT 練習對話｜實用免費外掛工具＆擴增功能 Voice Control for Chat

調校電腦系統軟硬體，開啟 ChatGPT 的語音外掛，擴增 ChatGPT 的語音功能，升級進化 AI !!!

#語言學習#AI#ChatGPT

2023/06/08

阿Han的沙龍

【Google Colab Python系列】初探Whisper: 來一段Youtube影片進行語音辨識吧！

這個篇章主要是讓我們能夠熟悉Whisper的安裝與使用方式，並簡單的對Youtube影片進行線上翻譯的工作，主軸在於了解一下整個Whisper使用方式到底是簡單還是複雜，就讓我們一起來玩玩看吧！在這之前我們還是說一下Whisper它是什麼樣的一個工具，能夠做什麼？ Whisper 是OpenAI

#whisper#AI#語音辨識

2023/04/23

阿Han的沙龍

【Google Colab Python系列】初探Whisper: 來一段Youtube影片進行語音辨識吧！

#whisper#AI#語音辨識

2023/04/23

Wei 的工程師聊什麼

使用 OpenAI Whisper API 進行語音轉文字，方便字幕後製或內容整理

本文介紹如何設置OpenAI API密鑰並使用Whisper API轉寫音訊檔案。文章詳細說明了轉寫單個音訊檔案，以及將長音訊分割並轉寫的過程。透過範例演示，讀者可以學習如何將音訊轉寫為文字，提高工作效率。

#OpenAI#檔案#程式

2024/02/13

Wei 的工程師聊什麼

使用 OpenAI Whisper API 進行語音轉文字，方便字幕後製或內容整理

#OpenAI#檔案#程式

2024/02/13

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

長期以來，西方美學以《維特魯威人》式的幾何比例定義「完美身體」，這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯．奧尼奎庫的舞作《轉轉生》，探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

趙鐸的沙龍

《轉轉生 Re:INCARNATION》：釋放差異的身體裂縫

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28

螃蟹_crab的沙龍

[Python]使用SpeechRecognition進行語音辨識

本文主要使用SpeechRecognition來做一個簡單的語音辨識，使用pyqt5介面呈現。按下Start Recording，開始錄音，並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording，稍等片刻後就會呈現出辨識結果程式範例 import sys i

#Python#語音辨識#SpeechRecognition

2024/06/22

螃蟹_crab的沙龍

[Python]使用SpeechRecognition進行語音辨識

#Python#語音辨識#SpeechRecognition

2024/06/22

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇：帕拉贊諾夫的十段殘篇》，如何以十段殘篇，結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭，探討藝術在儀式消失的現代社會如何承接意義，並展現不羈的自由靈魂。

#釀電影#釀評論#藝術評論

2026/02/11

釀電影，啜一口電影的美好。

《傳奇：帕拉贊諾夫的十段殘篇》：一場跨越時空的藝術對話，在舞臺上重現自由靈魂

#釀電影#釀評論#藝術評論

2026/02/11

無限智慧學院的沙龍

三分鐘內實作聲音轉字幕網頁App

相信替影片配字幕是許多人心中的痛，本文帶你在三分鐘內能夠用你的電腦，實做聲音轉字幕網站，準備好了就來吧!

#Huggingface#github#三分鐘

2023/11/04

無限智慧學院的沙龍

三分鐘內實作聲音轉字幕網頁App

相信替影片配字幕是許多人心中的痛，本文帶你在三分鐘內能夠用你的電腦，實做聲音轉字幕網站，準備好了就來吧!

#Huggingface#github#三分鐘

2023/11/04

Amily的沙龍

在理解與拒絕之間：從多重身分觀看《海妲．蓋柏樂》

若說易卜生的《玩偶之家》為 19 世紀的女性，開啟了一扇離家的窄門，那麼《海妲．蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆，同為熟稔文本的演員，亦是深刻體察制度縫隙的當代女性，此文所看見的不僅僅是崩壞前夕的最後發聲，更是女人被迫置於冷酷的制度之下，步步陷入無以言說的困境。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28