tesseract-ocr是一個(gè)支持中文識(shí)別的引擎,小編為您帶來了tesseract-ocr3.02版本,還附帶上了簡體中文的語言包,你可以用來開發(fā)識(shí)別圖片中文的項(xiàng)目!
tesseract-ocr介紹
Tesseract是一個(gè)開源的OCR(Optical Character Recognition,光學(xué)字符識(shí)別)引擎,可以識(shí)別多種格式的圖像文件并將其轉(zhuǎn)換成文本,目前已支持60多種語言(包括中文)。 Tesseract最初由HP公司開發(fā),后來由Google接盤。
tesseract-ocr安裝步驟
1、運(yùn)行exe安裝程序
2、點(diǎn)擊接受許可協(xié)議
3、點(diǎn)擊下一步
4、選擇安裝目錄
5、一直點(diǎn)下一步,然后點(diǎn)安裝,安裝完成!
測試tesseract-ocr識(shí)別效果
首先,建立在桌面建立一個(gè)test文件夾,里面放一張有中文的圖片tset.png
cd到這個(gè)目錄,輸入tesseract tset.png output_1 -l chi_sim
運(yùn)行成功,進(jìn)入test文件夾查看效果
多了一個(gè)output_1.txt文件,里面有東坡下載四個(gè)字,完美識(shí)別了test.png里面的文字。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版