前段時間,微信 PC 端更新了一個 OCR 功能,能識別圖片里的文字。
說實話,這應(yīng)該是微信 10 年來推出的最實用功能之一了。
比如你用微信截圖時,只要點擊下方的「 識別文字 」,就可以獲取截圖里的文字。
在微信里收到的圖片,也支持你直接選取文字復(fù)制。
除了功能實用,另一方面,微信早已成了電腦上必裝軟件,微信截圖也是很多人默認截圖工具。
所以微信 OCR 就好比系統(tǒng)功能一樣,無需任何安裝成本,以后遇到什么無法復(fù)制的文字,調(diào)出微信就好。
一般來說,微信 OCR 是可以滿足大部分人的需求。
但因為功能較基礎(chǔ),在一些特殊情況時,它就顯得有點笨了。
比如你有很多文字需要識別,那就得一次次截圖再一次次識別,再一次次復(fù)制。
或者你要 OCR 一段古詩,文字是縱向且自右向左,那微信識別出的順序就會亂。
就在最近,世超發(fā)現(xiàn)了一款叫 Umi-OCR 的工具( 支持 Win10&11 )。
它的功能很強大,支持你批量識別圖片、選擇屏蔽區(qū)域、指定文字方向,微信能不到的它都能做到。
噢最關(guān)鍵的是,它免費開源,無需安裝、無需網(wǎng)絡(luò),離線可用。
簡單給大家演示一下。
假如下面是一段要充錢才能復(fù)制的文字,我們點擊軟件的截圖功能,然后把文字框住,0.73 秒后就能獲得文字。
因為是本地運行,電腦性能越強,耗時會越短。
和微信不同的是,Umi-OCR 自帶了一個記錄板,每次識別出的文字會出現(xiàn)在記錄板,并一直保存。
這就是說,如果你有一堆要識別的文字,就可以像打連狙一樣,連續(xù)截圖。
截完所有的圖片,記錄板上也已經(jīng)識別了所有文字。
到這時你再來復(fù)制粘貼啥的,會方便很多。
當(dāng)然還有一種情況,你本地里已經(jīng)存好了所有的圖片,那這就更方便了。
Umi-OCR 支持批量識別,如果說剛才是連狙,那么這個功能就是一鍵加特林。
直接扔幾百張圖片過去,剩下的交給 Umi-OCR。
接著,記錄板上就會出現(xiàn)一行行的文字。
與此同時,識別結(jié)果還會以 txt 文件保存起來,可以說一條龍服務(wù)齊全了。
如果你不需要 txt,而是 md、jsonl 的格式,沒關(guān)系它都支持。
除了剛才說的這幾項,Umi-OCR 還有一些細節(jié)功能,可以照顧到特殊情況。
舉個例子,下面這個圖你只想要正文里的那一句話,水印等其他無效信息不想要。
要是一張圖,你截圖劃一個區(qū)域就行了。
但要是有 100 張類似的圖呢?
誒,這個軟件支持你指定識別區(qū)域。
只要你導(dǎo)入一張照片,然后選擇一些要屏蔽的區(qū)域,那接下來所有同分辨率的圖片,識別時就會自動屏蔽這些區(qū)域。
這樣批量識別出的結(jié)果,就只有我們想要的部分了。
另外,Umi-OCR 還可以調(diào)整段落化。
什么意思呢,一般 OCR 段落識別是根據(jù)行距來的,行與行之間空隙大了,它就會判斷為下一段。
但如果遇到下面這樣的特殊格式,一句話就是一段,距離很近,那 OCR 工具會把它們識別成一句話,合在一起。
比如微信識別出來是這樣的。
但 Umi-OCR 支持段落優(yōu)化,不同的段落格式可以選擇不同的設(shè)置,如單行優(yōu)化、左對齊、自然段等等。
遇到剛才的格式,就可以選擇「 優(yōu)化單行 」。
其他的情況也都有對應(yīng)的選項,下圖供參考。
最后,Umi-OCR 還支持更改文字識別方向。
比如你要識別一首古詩,只要選擇一下「 文字方向為縱向、從右到左 」即可。
對了有一點忘了提,除了支持中文、英文識別,通過導(dǎo)入多語言識別擴展包,Umi-OCR 還支持繁中、日、韓、俄、德、法等語言,鏈接會一起放在文末。
我知道,大家肯定關(guān)心它的識別準確率,我只能說表現(xiàn)尚可。
在第一張測試圖里,世超就發(fā)現(xiàn)捂臉表情被識別成一個( ,然后少了一個引號和一個句號。
小表情識別成文字,這點錯誤各位應(yīng)該可以接受,畢竟沒多少文章像我們這樣,寫著寫著塞點表情。
引號和句號丟失,我認為無傷大雅。
但除了這幾個問題,Umi-OCR 也會識別錯文字,比如把「 畢竟 」識別成了「 華竟 」。
另外,世超建議各位不要用它識別一些粗體字,效果不太理想。
當(dāng)然,大家也不要因此拒絕使用 Umi-OCR,市面上就沒有一家 OCR 工具敢保證 100% 準確率。
像剛才的古詩,Umi-OCR 錯了最后一個字,但微信 OCR 識別下來,就沒幾個對的了。
此外,微信 OCR 還會把粗體的 MVP 識別成 MUP。
所以說,使用 OCR,不管你用的是哪家,都要做好會遇到識別錯誤的準備。世超是建議大家每次自己再簡單檢查一遍。
還是那句話,如果只是偶爾需要 OCR,那還是微信好。
但如果你的需求很大,很特殊,害怕泄露隱私啥的,那這款 Umi-OCR 更適合你。
非常感謝大家對曉技巧第三期文章的支持,看到大家的熱情和關(guān)注,現(xiàn)在繼續(xù)為大家?guī)硐乱黄诘谋貍滠浖扑]。大家別顧著收藏,記得點贊呦。關(guān)注我,下期內(nèi)容更精彩!
一、騰訊辦公軟件
騰訊公司開發(fā)的各種即時通訊軟件,包括QQ、微信、TIM、企業(yè)微信等。這些聊天軟件提供了文字聊天、語音聊天、視頻聊天、文件傳輸?shù)裙δ埽殉蔀槿粘I钪斜夭豢缮俚墓ぞ咧弧?/p>
二、遠程軟件
遠程控制軟件是一種非常實用的辦公軟件。利用遠程控制軟件,用戶可以在不同的地點通過網(wǎng)絡(luò)實現(xiàn)遠程控制其他計算機,包括打開文件、運行程序、傳輸文件、監(jiān)控屏幕、發(fā)送消息等等。這種方式可以實現(xiàn)遠程辦公、遠程維護、遠程教育、遠程支持等多種應(yīng)用場景,非常方便和高效。這里推薦Todesk和向日葵遠程控制。
三、思維導(dǎo)圖
思維導(dǎo)圖可以讓用戶更加直觀地表達和組織自己的思路。可以創(chuàng)建各種不同類型的筆記,例如思維導(dǎo)圖、腦圖、流程圖、大綱等。還支持多人協(xié)作,適合需要頻繁整理和歸納信息的人士,例如學(xué)生、教師、研究人員、企業(yè)人員等。這里推薦幕布。
四、PDF轉(zhuǎn)換軟件
PDF轉(zhuǎn)格式也是經(jīng)常會用到的功能,但是,當(dāng)前市面上的許多轉(zhuǎn)換軟件在轉(zhuǎn)換效果和收費方面都存在一些問題,這給用戶帶來了很多不便。因此,為了方便大家的使用,這里推薦PDF24和PDF Shaper Free,它們不僅轉(zhuǎn)換效果較好,而且還提供免費服務(wù),可以滿足大家多樣化的需求。
五、辦公軟件WPS
對于在辦公室的工作人員,辦公軟件也是必不可少,現(xiàn)在一般安裝的都是wps或者Microsoft Office的辦公軟件,這里推薦國產(chǎn)的WPS軟件考試專用版。特別推薦在校學(xué)生使用。
六、強大的剪貼板增強工具
Ditto是一款免費、開源的剪貼板管理工具,它可以讓你方便地存儲、管理和檢索剪貼板歷史記錄,從而提高你的工作效率。使用Ditto可以避免重復(fù)輸入、復(fù)制粘貼等操作,節(jié)省你的時間和精力,讓你專注于更重要的工作。如果你經(jīng)常使用剪貼板,那么Ditto是一款值得嘗試的工具。
七、OCR文本識別工具
文字識別在日常中使用中很方便,OCR就是使用人工智能技術(shù)的文字識別系統(tǒng),可以將圖片或掃描件中的文字內(nèi)容自動識別并轉(zhuǎn)換為文字文檔,不再需要手動輸入文字,可以大大提高工作效率,節(jié)省敲字時間和精力。這里推薦天若文本識別和PandaOCR.Pro。
各位家人們記得關(guān)注點贊喲,下期再見!