電腦也能看懂圖片-善用AI的OCR能力

更新 發佈閱讀 3 分鐘
vocus|新世代的創作平台

好像還在4、5年前的時候,我們利用網路搜尋功能,搜尋資訊時多數還是以文字搜尋為主,很多時候如果我們對圖像資訊有疑問,通常我們接收資料後,必須在腦中轉化成文字內容再於瀏覽器的搜尋欄位輸出成文字。現在使用AI進行以圖搜尋的功能越來越普及了,如果能善加利用,肯定能夠增加工作上的效率!

OCR指的是Optical Character Recognition,是一項讓電腦能夠「讀懂」圖像中的文字,並將其轉換為可編輯、可搜尋的數位文字格式的技術,最普遍應用於日常生活中的情境應該就是停車場的車牌辨識系統,攝影機拍攝車牌內容後再上傳至系統進行文字辨識,建立停車資訊;另外像是申請金融服務時,部分應用程式也可以透過拍攝身分證卡面,經過系統辨識後,將很多繁瑣的內容自動填入欄位,減少不少的作業時間。

目前各家的大型語言模型,多數都已經有OCR的能力了,從最簡單的辨識文字,一直到菜單、海報甚至是單純的影像,都能夠將內容資訊進行蒐集,再依照我們的需求指令搜索資訊,而目前OCR的能力也已經再延伸到將辨識的內容應用於圖片生成(相關的應用在之前圖片生成功能的文章也有帶到)、影片生成的功能,發展速度之快。

vocus|新世代的創作平台

如果你是行政人員,免不了就是會有一些紙本文件,有時候要將內容建立成電子檔時,傳統手key會讓人發狂,現在可以拍個照上傳到語言模型,請他進行內容的全文輸出或是摘要。如果你是正在看原文書的同學,閱讀英文如果太過吃力,同樣也可以透過這種方式進行內容翻譯。如果你像我一樣是在學習AI應用的人,電腦操作時遇到不懂的內容也可以截圖下來,讓AI為你進行問題的分析與解說。

實在是有太多應用與發揮的場合了,以前遇到問題除了一開始要釐清問題,將關鍵字精準在google中搜尋,還要再將搜尋好的內容作整理以及分類,挑出合適自己問題的解答。現在的語言模型提供的內容幾乎等於一站式服務中心,就只要截圖上傳問問題就好,甚至不精準的問題AI還會另外進行詢問,還有可能幫你抓出其他有問題的內容。這麼好用的功能,如果還沒有使用過,推薦一定要試試看。

留言
avatar-img
園丁的AI練習手記
0會員
13內容數
觀賞植物種久了,怕與社會脫節。 抱著同時也對AI工具好奇的心態,將學到的事物記錄下來,也在平台上分享。
你可能也想看
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
本文討論了在AI時代下我們需要具備的職能,例如提問力、判斷力和專業能力。同時也提到了在使用AI時需要注意的事情,以及一些問答希望可以跟讀者有所互動與交流。另外作者也分享了自己使用AI工具的心得,並期待可以幫助初學者更快地瞭解如何應對AI的基礎邏輯。
Thumbnail
本文討論了在AI時代下我們需要具備的職能,例如提問力、判斷力和專業能力。同時也提到了在使用AI時需要注意的事情,以及一些問答希望可以跟讀者有所互動與交流。另外作者也分享了自己使用AI工具的心得,並期待可以幫助初學者更快地瞭解如何應對AI的基礎邏輯。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
未來,針對圖片生成的 prompt engineering 可能會越來越不重要。
Thumbnail
未來,針對圖片生成的 prompt engineering 可能會越來越不重要。
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
🚀 正在為翻譯掃描書籍PDF而苦惱嗎?🧐 使用 PDFtoPDF.ai,輕鬆將圖片轉換為文字並翻譯!對於需要快速參考和理解外文文本的學生來說,非常完美。透過高精度OCR和簡便的翻譯工具,提升你的學術工作效率。📚✨
Thumbnail
🚀 正在為翻譯掃描書籍PDF而苦惱嗎?🧐 使用 PDFtoPDF.ai,輕鬆將圖片轉換為文字並翻譯!對於需要快速參考和理解外文文本的學生來說,非常完美。透過高精度OCR和簡便的翻譯工具,提升你的學術工作效率。📚✨
Thumbnail
這篇文章介紹了 12 個超酷的免費 AI 工具,讓你讀書事半功倍,成績突飛猛進!從課堂筆記到科研論文,這些 AI 工具都能助你提高效率,增進學習成效。
Thumbnail
這篇文章介紹了 12 個超酷的免費 AI 工具,讓你讀書事半功倍,成績突飛猛進!從課堂筆記到科研論文,這些 AI 工具都能助你提高效率,增進學習成效。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News