幾種常見的AI應用類型

更新 發佈閱讀 6 分鐘

市面上已有許多AI工具,但對企業而言,若將內部資料直接公開餵給這些服務商,等於對全世界公諸於世自己的商業機密與Know-How,這些資料也將變成訓練資料集的一部分。此外,許多專業術語,恐有會錯意導致輸出結果偏差的可能。

因此往往涉及企業內部的資料,會與外界隔絕起來,獨立做訓練,在輔以市面現存的AI應用加以結合,除了達到AI應用的目的,還能避免資料外流。

為了達到上述方式,企業主要有兩種方法,一種是自建實體伺服器的本地私有雲模式,另一種是與AI雲端服務商洽談企業客製化方案,確保資料僅供自家公司存取使用,不會成為公有訓練資料集的一部分。(不論哪種方式各有利弊,但非本篇重點內容,容筆者不再贅述)

不論哪種方式,企業在AI應用場景上,常見的應用可以分成以下幾種類型:

文字AI應用

最基本的AI模型,最終應用場景主要為:客服機器人、知識管理、文件轉譯、書面教材、文件版本管理等等,與書面文字為主要的應用場景相關。

這邊所說的文字,大多是混合圖文 PDF(含報告、說明書、表格)基礎,屬於一般企業內部文件類型。此外還包括爛大街的辦公室軟體MS Office系列,常見的又以Word、Excel、PowerPoint、Outlook、Teams等等。

通常與字串相關的內容,涉及一般純文字說明的條列、報告、章節,以及表格 、內嵌圖片(年報、財務表、規格書等)。如果有些資料僅有書面文件,則需要掃描輸入後,將掃描檔轉換成文字,至於能轉換文多少比例,依OCR的畫質、字體、排版、清晰度等因素而異。

圖像AI應用

這邊說的圖像,不是指工程用的CAD圖檔,或是醫學用的病理圖像,而是一般常見的BMP、JPG、PNG、WEBP等,圖像來源可能來自專業相機、手機、截圖、網路、繪圖等等。

圖像AI應用眾多,從判別圖像物件並標記、風格轉換、AI生成、去背、後製、瑕疵檢驗、金相分析、畫質修復、畫質調整等應用。

現在最常應用的地方,2B就是商案圖像素材的生成,2C就是社群行銷素材的生成,這些沒版權疑慮的AI生成圖像,大幅衝擊整個產業鏈生態。

印象很深刻,朋友創業做商攝,因為AI導致業績一落千丈;
親戚原先專職影像後製的生意掉了許多,如今要去外頭打工兼職求生。

音訊/語音AI應用

目前的語音模型常用於口語辨識、音譯、AI語音生成、語音辨識轉文字等AI應用。其中,涉及語音轉文字,則又會將模型轉到字串算力需求的部分。

常見企業應用於會議紀錄上,錄製內容並傳換成文字會議紀錄。

另外還有取代真人錄製語音內容,透過真人音檔訓練AI語音與口氣,後續就能照著逐字稿或腳本朗讀內容。有些企業甚至會拿來訓練老闆語音,用來傳達政令、價值觀、致詞等用途,表示老闆重視該議題、彷彿人在現場的臨場感。

影像AI應用

自駕車、醫學影像、影像生成、風格轉換、照片轉動畫、瑕疵檢驗、人流分析、影像辨識(車牌、人臉特徵、物品、生物)等AI應用。

以終端通路的企業來說,透過監視器與AI導入人流分析,是幫線下門市導入數位化的敲門磚,就能跟線上通路一樣根據流量×觸及×轉換×客單價進行更進一步的分析與應用。

對於安全有較高需求的場域,像是機場、車站、車廂內部、工廠等地,可以透過訓練辨識危險物品來及時監控潛在犯罪行為,提早預防危險發生。

複雜格式AI應用

尖端科技、核能、科學、軍用、量子電腦等等,由於過於高深,筆者未有攝入。

不過少數能說出口的複雜應用,其中之一就是常見於製造業與營建業的CAD工程圖檔。CAD圖檔不是純文字、也不是單純圖片,而是結構化的技術資料格式

通常會用到CAD圖檔,有些是希望AI能自動將360環繞影片、照片轉換成三視圖CAD圖檔,甚至自動轉換成立體圖面,哪些工程結構需要幾支螺絲等等,倘若有圖面規範,圖面自動照著規範製圖、標註與敘述。

CAD做為工程師溝通的介面,CAD的圖面內容很重要。單一張CAD所需要的算力多寡,根據CAD圖的解析度、物件數量、尺寸、圖層數量等資訊決定。打個比方,一張 300MB~2GB 的CAD圖檔轉成純圖片時,可能會是超大解析度圖檔(如 8000×8000 px)。

可以說,不論是AI應用程度,還是算力需求大小,源頭皆取決於CAD圖檔的複雜度

之後根據AI應用,在預處理(DWG解析、元件過濾/分類、結構化轉換、圖像渲染等)、以及後續不同應用階段的AI模型選用,都會影響算力需求與實際輸出結果。

透過AI自動化大幅減少人力成本與時間外,人們扮演的角色也從原先的製圖工程師,轉換成檢驗紙上作業能否具體實施的老師傅。

總結:MultiModal 多模態應用

基本上很難有單一類別的AI應用類型,或多或少都會兩三種類型混合,這些不同類型的資料叫做「模態」。像是書面文件不僅有文字,圖片的部分就需要專門處理圖像的AI模型;想要把會議內容變成逐字稿,並摘要重點,就需要音訊+文字的AI模型做搭配。

即便是單一類別的AI應用,也需要各種不同的AI模型完成系統建置。像是商場想要導入人流分析,從影像預處理、特徵分析、物件偵測、密度估計、目標追蹤,各有不同的AI模型需要定義與訓練。倘若還要能根據影像作即時處理與分析,那麼要求持續運作的算力與AI運作模式又要另外檢討。

關於AI多模態的例子,最經典的莫過於ChatGPT的跌代,從簡單對話、一篇文章重點摘要、翻譯、研究報告、語音輸入、圖片生成、圖片風格轉換等等。未來不論OpenAI是自行開發與精進AI模型,還是從第三方導入,ChatGPT可能往會更多工、更精準、更面面俱到的方向前進。

以上內容就是筆者在工作崗位上接觸到的AI應用幾大類型,根據自己的認知做些粗淺介紹,若有敘述不周或內容錯誤,還請各路高人補充與指正。

留言
avatar-img
Patrick.Wong的沙龍
266會員
545內容數
一位在因緣際會之下,動了想去紐西蘭的念頭,卻陰錯陽差跑到澳洲打工度假的背包客。 脫離台灣世俗的期待,踏上打工度假的不歸路,第二人生正式在澳洲啟航。 如果人生很短,那青春就是短暫一瞬間,屬於你的第二人生,下一站在哪呢?還沒開始的理由,又是什麼呢? 歡迎來到我的澳洲故事館,分享我在澳洲的旅程故事。
Patrick.Wong的沙龍的其他內容
2025/11/01
基本公式:GPU算力=理論峰值×實際效能×加速比。 GPU該如何提升算力實際利用率,從硬體規格就開始。 根據使用情境與AI應用,推估出所需算力,才能知道有哪些等級的GPU可滿足AI用途,最終根據終端AI運用情境、所需算力與GPU型號決定硬體配置。
Thumbnail
2025/11/01
基本公式:GPU算力=理論峰值×實際效能×加速比。 GPU該如何提升算力實際利用率,從硬體規格就開始。 根據使用情境與AI應用,推估出所需算力,才能知道有哪些等級的GPU可滿足AI用途,最終根據終端AI運用情境、所需算力與GPU型號決定硬體配置。
Thumbnail
2025/10/26
用AI檢測器檢測自己文章的AI化程度:沒有AI協作的文章被檢測有AI生成的成分,這結果我也是驚了個呆!
Thumbnail
2025/10/26
用AI檢測器檢測自己文章的AI化程度:沒有AI協作的文章被檢測有AI生成的成分,這結果我也是驚了個呆!
Thumbnail
2025/10/18
青年安心成家貸款對新增房貸造成的影響與變化:每個月有五分之一的撥貸戶數與金額屬於新青安貸款,與舊青安時期形成鮮明對比。
Thumbnail
2025/10/18
青年安心成家貸款對新增房貸造成的影響與變化:每個月有五分之一的撥貸戶數與金額屬於新青安貸款,與舊青安時期形成鮮明對比。
Thumbnail
看更多
你可能也想看
Thumbnail
在上一章節中,我們介紹了音樂生成的基本原理以及幾款熱門的 AI 音樂生成工具。今天要接著介紹其中一款熱門的工具「Suno」,讓你了解它的介面設計、實際應用範例以及常用的提示詞,幫助你更好地運用這個平台來實現音樂創作的夢想。
Thumbnail
在上一章節中,我們介紹了音樂生成的基本原理以及幾款熱門的 AI 音樂生成工具。今天要接著介紹其中一款熱門的工具「Suno」,讓你了解它的介面設計、實際應用範例以及常用的提示詞,幫助你更好地運用這個平台來實現音樂創作的夢想。
Thumbnail
Pixverse 是一個免費的 AI 影片生成器,它可以根據您輸入的文字或圖片,生成各種風格和主題的高質量的影片,它有分成網頁版和 Discord 版,今天要介紹的是網頁版的 Pixverse,介面簡單好操作,只需要在輸入框輸入您的想法,選擇相關設定,就可以生成相應的影片,更棒的是,還可以商用呢!
Thumbnail
Pixverse 是一個免費的 AI 影片生成器,它可以根據您輸入的文字或圖片,生成各種風格和主題的高質量的影片,它有分成網頁版和 Discord 版,今天要介紹的是網頁版的 Pixverse,介面簡單好操作,只需要在輸入框輸入您的想法,選擇相關設定,就可以生成相應的影片,更棒的是,還可以商用呢!
Thumbnail
Haiper AI 是一款免費的影片生成工具,是由 Google DeepMind 研究人員開發,只只需要輸入文字提示詞,就能生成各種場景的高質量的影片。
Thumbnail
Haiper AI 是一款免費的影片生成工具,是由 Google DeepMind 研究人員開發,只只需要輸入文字提示詞,就能生成各種場景的高質量的影片。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
Suno 是一款免費的 AI 音樂生成工具,只要輸入文字就能輕鬆作曲,無論是英文、中文歌曲,都能依照指定風格生成一首歌曲,最近開放 V3 模型,可以使用V3 模型生成 2 分鐘的歌曲,沒有任何音樂知識,也能輕鬆創作。
Thumbnail
Suno 是一款免費的 AI 音樂生成工具,只要輸入文字就能輕鬆作曲,無論是英文、中文歌曲,都能依照指定風格生成一首歌曲,最近開放 V3 模型,可以使用V3 模型生成 2 分鐘的歌曲,沒有任何音樂知識,也能輕鬆創作。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
Felo AI 是一款創新的人工智慧工具,專為幫助使用者快速搜尋和生成簡報而設計。本文將介紹透過 Felo 製作簡報的詳細步驟,從語系設置到簡報下載,讓使用者能以更高效率創建專業質感的簡報。Felo 不僅節省時間,還提供即時更新的資料和多樣化的設計選擇,讓簡報製作變得輕鬆且高效。
Thumbnail
Felo AI 是一款創新的人工智慧工具,專為幫助使用者快速搜尋和生成簡報而設計。本文將介紹透過 Felo 製作簡報的詳細步驟,從語系設置到簡報下載,讓使用者能以更高效率創建專業質感的簡報。Felo 不僅節省時間,還提供即時更新的資料和多樣化的設計選擇,讓簡報製作變得輕鬆且高效。
Thumbnail
Gamma AI是一款創新的簡報生成工具,透過人工智慧技術,使用者只需提供簡單的主題或大綱,即可快速產出專業級的簡報內容。這款工具具備智能設計建議、自動排版、多樣模板及實時協作等功能,顯著提高簡報製作效率。
Thumbnail
Gamma AI是一款創新的簡報生成工具,透過人工智慧技術,使用者只需提供簡單的主題或大綱,即可快速產出專業級的簡報內容。這款工具具備智能設計建議、自動排版、多樣模板及實時協作等功能,顯著提高簡報製作效率。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06,似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現,以及多模態應用的突破,成為最新的AI焦點。
Thumbnail
Google 在 2025 年 5 月 6 日發布了 Gemini 2.5 Pro Preview 05-06,似乎在為即將登場的 Google I/O 2025 開發者大會預熱。這款更新版模型以其卓越的編碼能力、前端網頁開發表現,以及多模態應用的突破,成為最新的AI焦點。
Thumbnail
StockCake 是一個由 AI 人工智慧技術生成免費的圖庫網站,提供大量高品質多類型的圖片,效果逼真,對無論你是要用在專案、網站還是製作簡報,不用註冊或登入即可下載並取得圖片,可用於個人和商業用途,且無需標示出處或作者。
Thumbnail
StockCake 是一個由 AI 人工智慧技術生成免費的圖庫網站,提供大量高品質多類型的圖片,效果逼真,對無論你是要用在專案、網站還是製作簡報,不用註冊或登入即可下載並取得圖片,可用於個人和商業用途,且無需標示出處或作者。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News