OCR文字識(shí)別軟件在現(xiàn)在是很多的人都是在使用的,但是有一些朋友都是覺(jué)得自己的OCR文字識(shí)別軟件識(shí)別文字不怎么高,這個(gè)是什么樣子的原因以及怎么來(lái)才可以更好的去解決掉了,小編就來(lái)告訴你吧!
OCR文字識(shí)別軟件的識(shí)別率不高原因以及解決辦法
首先需要肯定地告訴你.造成OCR效果不佳的原因絕對(duì)不是軟件的問(wèn)題,也不是掃描儀分辨率不高。而是操作上的問(wèn)腸.事實(shí)上.這一問(wèn)題比較突出.大家在使用OCR時(shí)應(yīng)該注意如下幾點(diǎn):
1、不要使用最高分辨率,300dpi足矣。過(guò)高的分辨率反而會(huì)使得OCR辨認(rèn)困難,特別是在一些存在輕微掃描失真的掃描儀上。一般而言600dPi是針對(duì)一些字體特別小的稿件.
2、手動(dòng)清除干擾內(nèi)容。由于紙張的原因,不少稿件在掃描時(shí)都會(huì)有干擾的小點(diǎn),此時(shí)建議在識(shí)別之前人工清除,這樣可以避免很多怪異的字符。此外,掃描之前必須執(zhí)行水平矯正,保證所有文字的水平。
3、巧妙使用灰度掃描。對(duì)于一些紙張較薄的稿件,掃描時(shí)很可能會(huì)因?yàn)橥该鞫艿奖趁嫖淖指蓴_嚴(yán)重影響OCR成功率。為此,建議大家使用灰度掃描,盡管速度慢一些,但是效果會(huì)好很多。
做到上述三點(diǎn),相信你的OCR文字識(shí)別軟件的識(shí)別率會(huì)大大提高。但是值得提醒的是,識(shí)別率的提高并不代表說(shuō)完全沒(méi)有錯(cuò)誤的出現(xiàn),就算是人工輸入也會(huì)有出錯(cuò)的時(shí)候,而且出錯(cuò)的機(jī)率可能比軟件識(shí)別更大。所以,識(shí)別完成之后一定要進(jìn)行人工校對(duì),校對(duì)完成才算真正的完成工作。