/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
專業的一款圖像識別軟件,Tesseract OCR官方版帶給大家。Tesseract OCR官方版可以為用戶將圖像提供一個命令行工具,並且可以轉成文本信息,同時操作也是沒有那麼複雜,若是你正好在尋找這款軟件的話,可千萬不要錯過哦,還有更多功能等你來進行體驗!
去持多語言
支持包括英文,簡體中文,繁體中文,支持Windows,Linux,Mac OSX 多平台。使用中Tesseract 的識別率非常高。
命令行測試使用
接下來就可以使用tesseract進行圖片識別了。準備一副待識別的圖像,這裏用畫圖工具隨便寫了一段字,然後定義成1.jpg,在命令行中定位到圖片路徑然後輸入命令:tesseract 1.jpg result -l eng,其中result表示輸出結果文件txt名稱,eng表示用以識別的語言文件為英文。會發現圖片當前目錄下生成了1個result.txt文件裏麵結果為
增加中文語言庫
安裝目錄下的tessdata目錄存放的是語言識別包,如果想增加中文識別功能,可以將中文的語言庫放到此目錄下,下載後將解壓出的chi_sim.traineddata放到此目錄下。然後調用的時候指明語言庫即可,例如:tesseract xxx.jpg result -l chi_sim照樣。
Tesseract安裝
下載windows下的安裝文件.exe。安裝.exe。安裝成功後會在相應磁盤上生成一個Tesseract-OCR目錄。如圖我是安裝到了如下位置安裝完成打開命令行,輸入tesseract,安裝成功。