語音轉文字(Speech-to-Text)的三個工具使用心得: Handy, Wispr Flow, Typeless

更新 發佈閱讀 5 分鐘

(本篇文章是使用Typeless與Handy製作的)

最近使用了三個語音轉文字工具,分別是 Handy、Wispr Flow 與 Typeless。先大約講一下我目前的使用情境:

在以下情境中,我常常使用的語言有三種:中文、英文跟日文。這三種語言會交替使用,也就是說可能會有中文夾雜英文的情況:

1. 大部分都還是在電腦版的 Line 做對話

2. 懶得打字或撰寫文章的時候

此外,我在網路上也有看到有人「用嘴做 Voice Coding」(用語音寫程式),聽說效果也很不錯。


結論

為了讓大家不用看那麼冗長的心得,我先把結論放在這裡:

如果你預算充足,直接購買 Typeless 的 Pro 版即可。如果你想省錢,有另一個次好的方法:

1. 同時下載 Typeless 與 Handy

2. 輸出長句子時,使用 Typeless

3. 輸出短句(一句話)時,使用 Handy

我覺得這是最能夠節省成本,並保持免費額度的一個方法。


接下來會講解一下這三個工具我目前的使用心得,以及各自的優劣勢:

Handy

https://handy.computer/

首先是 Handy,這是一個免費的開源的語音轉文字工具。

基本上下載之後,在它的程式裡面再下載一個語音轉文字的 model 下來,就可以直接使用。它目前能支援的模型有兩種:

1. Wisper

2. Parakeet(只支援英文)

我目前只使用的是whisper median這個模型,然後我認為它在語音轉中文的時候其實效果不錯。如果對於簡體中文有反感的使用者,其實它可以強制輸出成繁體中文。

優點是:

  • 免費
    缺點則有幾個:
  1. 它輸出的內容基本上就是你講的原話,不太會自動提供標點符號。這變成你每次輸出後,都還要重新看過一遍文字並手動加上標點。
  2. 它有時候會蹦出簡體中文,但這種情況蠻少的。
  3. 他的反應速度是三個工具裡面最慢的,也就是你在語音講完之後你必須要等個兩到三秒,甚至久一點五秒才會出現結果
  4. 如果是在句子中央夾雜英文、日文或中文等不同語言,它容易會偵測錯誤。


Wispr Flow

https://wisprflow.ai/

我之前就聽過 Wispr Flow,但最近才開始正式使用。相較於 Handy,它有幾個顯著的好處:

1. 自動修飾內容:它的輸出並非直接照錄說話內容,而是會經過修飾後再提供文字。

2. 優異的語言切換:在句子中夾雜中文、日文、英文時,它的偵測非常清晰。

3. 自動標點符號:它會自動提供標點,如果順利的話,講完就能直接輸出,最多只需修正一些專有名詞的錯字。

不過,它還是有一些缺點:

1. 簡體中文問題:即便要求輸出繁體,有時還是會跳出簡體中文。

2. 輸出非預期內容:這是我最困惑的地方,有時它會多出一些我沒說過的內容。甚至有一次我只說了「好的」,它卻直接輸出一整篇文章,讓我有點嚇到。

3. 轉換邏輯不穩:整體的轉換有時會顯得有點奇怪。

目前感受到的缺點大概就這幾個。

價格上來說,Wispr Flow 提供了免費版:在電腦上每週 2,000 字,而在 iPhone 上則是每週 1,000 字。

如果超過這個限額就需要付費,其計費方式如下:

1. 月繳:250 元台幣

2. 年繳:每月折合 200 元台幣


Typeless

最近看到有一些 KOL 在推薦 Typeless,我也在想 Typeless 的效果到底有多好,所以就把 Handy、Wispr Flow 和 Typeless 都下載下來試用了一遍。

相較於 Wispr Flow,Typeless 解決了非常多缺點:

1. 繁簡轉換問題:到目前為止,我遇到簡體中文輸出的狀況頻率低很多。

2. 輸出穩定度:我認為它的輸出非常穩定。

3. 轉換邏輯:在修飾內容的過程中,它的轉換邏輯是非常穩定的。

雖然它還是會蹦出一些小錯誤,但是這些錯誤我認為需要更改的頻率,相較於 Wispr Flow 來講低很多。所以這是我目前最推薦的一個語音轉文字

價格上來講,Typeless 免費版提供每週 4,000 字的輸出;超過 4,000 字的額度則需要付費。

付費方案分為兩種:

1. 月繳:每個月 $30 美金

2. 年繳:折合每個月 $12 美金

https://www.typeless.com/refer?code=JXYNX3U

上面的連結是我 Typeless 的 Reference Code,如果有人有興趣的話可以使用

留言
avatar-img
林承慶的沙龍
1會員
39內容數
林承慶的沙龍
林承慶的沙龍的其他內容
2026/02/19
日語學習者常遇到的「聽讀流利,但開口說不出來」的困境。本文實測以日語口說為核心的App,從日本語先生Aoi、簡單日語、Amiko、Aomi、Falou、Fully Fluent到TalkMe,分析各App的特色、優缺點,並提出適合的情境。希望能幫助學習者找到適合自己的口說練習工具。
Thumbnail
2026/02/19
日語學習者常遇到的「聽讀流利,但開口說不出來」的困境。本文實測以日語口說為核心的App,從日本語先生Aoi、簡單日語、Amiko、Aomi、Falou、Fully Fluent到TalkMe,分析各App的特色、優缺點,並提出適合的情境。希望能幫助學習者找到適合自己的口說練習工具。
Thumbnail
2026/02/14
Google 的 AI 團隊在 2025 年 12 月發布了一篇有趣的論文,探討如何提升大型語言模型(LLM)的效果。 研究指出,如果你想優化模型表現,有個非常簡單的方式:就是將問題講兩遍,甚至三遍以上。
Thumbnail
2026/02/14
Google 的 AI 團隊在 2025 年 12 月發布了一篇有趣的論文,探討如何提升大型語言模型(LLM)的效果。 研究指出,如果你想優化模型表現,有個非常簡單的方式:就是將問題講兩遍,甚至三遍以上。
Thumbnail
2026/02/14
台大 2025 年的 Web Programming 心得
2026/02/14
台大 2025 年的 Web Programming 心得
看更多
你可能也想看
Thumbnail
EF Hello app 利用先進的人工智慧技術提升學習者英語能力,有助於在聽、說、讀、寫各方面的英語能力。採用 AI 擬真對話練習,適合害羞人士,並提供多元學習機制、模組化設計及學習習慣養成。此外,更新與 AI 夥伴對話角色扮演功能,提升溝通技巧。適合各種英語學習者。
Thumbnail
EF Hello app 利用先進的人工智慧技術提升學習者英語能力,有助於在聽、說、讀、寫各方面的英語能力。採用 AI 擬真對話練習,適合害羞人士,並提供多元學習機制、模組化設計及學習習慣養成。此外,更新與 AI 夥伴對話角色扮演功能,提升溝通技巧。適合各種英語學習者。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
你習慣用語音來隨時紀錄自己的想法嗎? 自己口說成文有很多好處。首先,這種方式可以讓我們更加直觀地表達自己的想法,而不需要花太多時間思考如何用文字來表達。其次,通過口說,我們可以更加清晰地表達出自己的想法,進而更加了解自己的理解程度。而且,這種方式也可以幫助我們更好地記錄下自己的想
Thumbnail
你習慣用語音來隨時紀錄自己的想法嗎? 自己口說成文有很多好處。首先,這種方式可以讓我們更加直觀地表達自己的想法,而不需要花太多時間思考如何用文字來表達。其次,通過口說,我們可以更加清晰地表達出自己的想法,進而更加了解自己的理解程度。而且,這種方式也可以幫助我們更好地記錄下自己的想
Thumbnail
隨著AI技術的進步,即時同步口譯機的設計將顯示出其獨特的優勢,特別是聲音模擬的能力。透過AI模擬個人聲音,未來的翻譯軟體將能夠精準捕捉使用者的口氣與情感,提供無縫的語言溝通經驗。然而,人類翻譯的專業與情感理解仍是AI難以取代的。本文探討了即時翻譯技術的未來及其勢必將改變國際會議和日常溝通的方式。
Thumbnail
隨著AI技術的進步,即時同步口譯機的設計將顯示出其獨特的優勢,特別是聲音模擬的能力。透過AI模擬個人聲音,未來的翻譯軟體將能夠精準捕捉使用者的口氣與情感,提供無縫的語言溝通經驗。然而,人類翻譯的專業與情感理解仍是AI難以取代的。本文探討了即時翻譯技術的未來及其勢必將改變國際會議和日常溝通的方式。
Thumbnail
這是我第一次體驗到AI的力量有多強大,就像在海上漂流了好幾年終於抓到一根浮木!原本想說加強一下文法讓日記寫得更順暢,結果他給我的遠遠不只這樣。居然可以用 APP 練習各種情境對話,而且都是在美國真的會遇到的情境!如果我剛來的時候就知道用 EF Hello 練習口說,我的社交生活就不會那麼慘烈了吧。
Thumbnail
這是我第一次體驗到AI的力量有多強大,就像在海上漂流了好幾年終於抓到一根浮木!原本想說加強一下文法讓日記寫得更順暢,結果他給我的遠遠不只這樣。居然可以用 APP 練習各種情境對話,而且都是在美國真的會遇到的情境!如果我剛來的時候就知道用 EF Hello 練習口說,我的社交生活就不會那麼慘烈了吧。
Thumbnail
透過 【Elsa Speak x 英文探長J 專屬連結】 購買方案,會比在app內直接升級便宜哦
Thumbnail
透過 【Elsa Speak x 英文探長J 專屬連結】 購買方案,會比在app內直接升級便宜哦
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
#費用雜談    平心而論,Speak App 的收費絕對對得起你在英文家教平台上的體驗,最高方案,每月750元的收費,在一般時下的家教或是線上平台,差不多就是一堂至兩堂課的收費,因此就學習立場而言,幾乎是找不到不使用的原因。     但就理性觀點而言,筆者建議讀者們可以就幾個面向去思考:
Thumbnail
#費用雜談    平心而論,Speak App 的收費絕對對得起你在英文家教平台上的體驗,最高方案,每月750元的收費,在一般時下的家教或是線上平台,差不多就是一堂至兩堂課的收費,因此就學習立場而言,幾乎是找不到不使用的原因。     但就理性觀點而言,筆者建議讀者們可以就幾個面向去思考:
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
大家好,我是東東!今天要和大家分享一款可以讓圖片開口說話的AI工具——Hedra AI。接下來就讓我帶大家一起了解它的操作流程吧! 首先,在頁面的右上角找到並點擊「登入」按鈕,選擇 Google 登入即可。登入成功後,會進入主畫面,我們先點擊「Create」開始創作。 簡潔易用的界面設計
Thumbnail
大家好,我是東東!今天要和大家分享一款可以讓圖片開口說話的AI工具——Hedra AI。接下來就讓我帶大家一起了解它的操作流程吧! 首先,在頁面的右上角找到並點擊「登入」按鈕,選擇 Google 登入即可。登入成功後,會進入主畫面,我們先點擊「Create」開始創作。 簡潔易用的界面設計
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News