隨著語音技術越來越成熟,我們可以很輕鬆地在程式中實現:
👉 語音轉文字(Speech-to-Text)👉 語音助理 👉 語音控制工具
這篇帶你用 Python 快速做出一個「語音辨識」小範例。
🧩 安裝套件
先安裝必要套件:
pip install SpeechRecognitionpip install PyAudiopip install pyttsx3⚠️ PyAudio 安裝注意(很多人會卡)
如果你在 Windows 安裝失敗,可以試試:
👉 下載對應版本的 .whl 檔手動安裝
👉 或使用:
pip install pipwinpipwin install pyaudio🧩 匯入套件
import speech_recognition as srimport pyttsx3
🚀 基本範例:語音轉文字
import speech_recognition as srimport pyttsx3# 初始化語音引擎(文字轉語音)engine = pyttsx3.init()# 建立語音辨識器recognizer = sr.Recognizer()# 使用麥克風with sr.Microphone() as source: print("請開始說話...") audio = recognizer.listen(source)# 語音轉文字try: text = recognizer.recognize_google(audio, language='zh-TW') print("你說的是:" + text)except sr.UnknownValueError: print("語音無法辨識") text = ""except sr.RequestError as e: print(f"連線錯誤:{e}") text = ""
🔍 程式重點說明
🔹 Recognizer(語音辨識器)
recognizer = sr.Recognizer()
👉 負責處理聲音資料並轉成文字
🔹 Microphone(麥克風來源)
with sr.Microphone() as source:
👉 取得即時語音輸入
🔹 recognize_google(語音辨識)
recognizer.recognize_google(audio, language='zh-TW')
👉 使用 Google API 做辨識
👉 支援中文(台灣)
🧠 進階優化(很實用)
🔹 1. 降低環境雜音影響
with sr.Microphone() as source: recognizer.adjust_for_ambient_noise(source) print("請開始說話...") audio = recognizer.listen(source)
🔹 2. 加入說話回應(文字轉語音)
engine.say("我聽到了")engine.runAndWait()
🔹 3. 限制錄音時間
audio = recognizer.listen(source, timeout=5, phrase_time_limit=5)
⚠️ 常見問題
❌ 語音辨識失敗
👉 原因可能是:
- 環境太吵
- 麥克風品質不好
- 語音太短或太快
❌ 無法連線
👉 recognize_google 需要網路
🚀 應用場景
你可以把這套用在:
- 🔹 語音助理(像簡易版 Siri)
- 🔹 語音控制電腦
- 🔹 遊戲語音操作
- 🔹 無障礙應用
✨ 結語
透過 Python,你可以很輕鬆做到:
✔ 語音輸入
✔ 語音轉文字 ✔ 語音互動
這也是打造 AI 工具很重要的一步。
















