在數字信息的海洋中,文字是連接過去與未來的橋梁。然而,當這些文字被囚禁在圖像和PDF的牢籠中時,它們便失去了自由流動的力量。在這個世界里,有一個名為Umi的OCR軟件,它如同一位解放者,將文字從束縛中解救出來,賦予它們新的生命。
初春的午后,陽光透過半開的窗簾,灑在了李明的辦公桌上。他的目光落在了電腦屏幕上,那里顯示著一份密密麻麻的英文報告。作為一名數據分析師,他每天都要處理大量的文檔,從中提取關鍵信息。但是,今天的工作似乎比往常更加繁重,因為這份報告是掃描版的PDF,文字被牢牢地鎖定在圖像之中。
李明嘆了口氣,他知道這意味著他需要手動輸入這些文字,或者尋找一種方法將它們轉換成可編輯的文本。他記得曾經聽說過OCR技術,但市面上的軟件要么價格昂貴,要么需要依賴網絡連接。作為一名對技術充滿好奇心的人,他決定自己動手,尋找一個解決方案。
他打開了瀏覽器,輸入了“離線OCR軟件”幾個字,屏幕上立刻跳出了無數個搜索結果。就在這時,一個名為“Umi-OCR”的軟件吸引了他的注意。根據網頁上的描述,這是一款免費、開源且支持批量操作的離線OCR軟件,它支持Windows和Linux系統,并且內置了多國語言庫。
李明的心跳微微加速,他感到一種探險者發現新大陸般的興奮。他點擊了下載鏈接,一個小巧的.7z壓縮包很快就下載完成了。他雙擊文件,解壓到了桌面上的一個新建文件夾中。
軟件的界面簡潔而直觀,沒有過多的裝飾,給人一種專業而高效的感覺。李明注意到界面的右上角有一個齒輪圖標,他點擊了它,進入了全局設置。在這里,他可以調整軟件的各種參數,包括語言、主題、字體大小,甚至是OCR插件的選擇。
他選擇了中文作為界面語言,軟件立刻響應了他的選擇,所有的菜單和提示都變成了熟悉的中文。李明滿意地點了點頭,然后切換到了“截圖OCR”標簽頁。他閱讀了使用說明,了解到他可以通過快捷鍵喚起截圖功能,然后軟件會自動識別圖中的文字。
他決定先做一個小測試。李明打開了一個新的截圖工具,截取了報告的第一頁,然后將圖片復制并粘貼到了Umi-OCR中。軟件立刻響應,開始處理圖片。幾秒鐘后,屏幕上顯示出了識別結果,文字被整齊地排列在了窗口的右側。
李明仔細對比了原文和識別結果,發現準確率相當高,只有極少數的地方需要手動修正。他的心情變得激動起來,這正是他所需要的工具。他開始想象,有了Umi-OCR,他的工作效率將大大提高,再也不需要為處理掃描文檔而煩惱。
他繼續探索軟件的其他功能。在“批量OCR”標簽頁中,他看到了支持多種圖片格式的選項,以及文本后處理的功能,這可以讓識別后的文本更加適合閱讀和使用。他還發現了“忽略區域”的功能,這在處理含有水印或頁眉頁腳的文檔時非常有用。
在“文檔識別”標簽頁中,李明發現Umi-OCR不僅能處理圖片,還能識別PDF和其他電子文檔中的文字。他嘗試著打開了報告的PDF版本,軟件很快就完成了識別,并且提供了雙層可搜索的PDF輸出選項。
最后,他在“二維碼”標簽頁中發現了掃碼和生成碼的功能。雖然這與他的工作不直接相關,但李明覺得這是一個很有趣的額外功能。
當李明關閉Umi-OCR的時候,窗外的夕陽已經開始西下。他感到一種深深的滿足感,因為他知道,從今天開始,他的工作方式將徹底改變。Umi-OCR不僅是一個軟件,更是一個解放者,它解放了被囚禁在圖像中的文字,也解放了李明的生產力。
上文使用AI潤色軟件介紹,看官酌情輕噴,以下是軟件的正式介紹
軟件來源于開源;文末有下載地址
簡介:
OCR , free and offline. 開源、免費的離線OCR軟件。支持截屏/批量導入圖片,PDF文檔識別,排除水印/頁眉頁腳,掃描/生成二維碼。內置多國語言庫。
適用環境:
適用于 x64 、Linux x64
使用方法/教程:
軟件發布包下載為 .7z 壓縮包或 .7z.exe 自解壓包。自解壓包可在沒有安裝壓縮軟件的電腦上,解壓文件。
本軟件無需安裝。解壓后,點擊 Umi-OCR.exe 即可啟動程序。
界面語言
Umi-OCR 支持的界面多國語言。在第一次打開軟件時,將會按照你的電腦的系統設置,自動切換語言。
如果需要手動切換語言,請參考下圖,全局設置→語言/ 。
標簽頁
Umi-OCR v2 由一系列靈活好用的標簽頁組成。您可按照自己的喜好,打開需要的標簽頁。
標簽欄左上角可以切換窗口置頂。右上角能夠鎖定標簽頁,以防止日常使用中誤觸關閉標簽頁。
截圖OCR
截圖OCR:打開這一頁后,就可以用快捷鍵喚起截圖,識別圖中的文字。
文本后處理
關于 OCR文本后處理 - 排版解析方案:可以整理OCR結果的排版和順序,使文本更適合閱讀和使用。預設方案:
上述方案,均能自動處理橫排和豎排(從右到左)的排版。(豎排文字還需要OCR引擎本身支持)
批量OCR
批量OCR:這一頁用于批量導入本地圖片進行識別。
忽略區域
關于 OCR文本后處理 - 忽略區域:批量OCR中的一種特殊功能,適用于排除圖片中的不想要的文字。
文檔識別
文檔識別:
二維碼
掃碼:
Aztec,Codabar,Code128,Code39,Code93,DataBar,,,EAN13,EAN8,ITF,,,,,PDF417,QRCode,UPCA,UPCE
生成碼:
全局設置
全局設置:在這里可以調整軟件的全局參數。常用功能如下:
調用接口:構建項目第零步:(可選)fork本項目第一步:下載代碼
請參考 更新日志 開頭的說明。
后續步驟:
請跳轉下述倉庫,完成對應平臺的開發/運行環境部署。
下載發行版
以下發布鏈接均長期維護,提供穩定版本的下載。
?Scoop (點擊展開)
Scoop 是一款Windows下的命令行安裝程序,可方便地管理多個應用。您可以先安裝 Scoop ,再使用以下指令安裝 Umi-OCR :
scoop bucket add extras
scoop install extras/umi-ocr
scoop install extras/umi-ocr-paddle
*請認真填寫需求信息,我們會在24小時內與您取得聯系。