使用Google开源tesseract OCR用语言库报allow_blob_division解决方案

在使用语音库时候 遇到报错:allow_blob_division,例如使用chi_sim.traineddata;
在chi_sim.traineddata文件目录下,使用命令行执行:

combine_tessdata -e chi_sim.traineddata chi_sim.config

执行完后,在目录下出现chi_sim.config的文件,打开该文件;
在allow_blob_division        F这一行的前面加#,注释掉

即:# allow_blob_division        F    

然后,在执行命令行:
combine_tessdata -o chi_sim.traineddata chi_sim.config

到此在使用 chi_sim.traineddata文件就不会报read_params_file: parameter not found: allow_blob_division

当然,要使用上面的命令行,需要安装Tesseract-OCR 

文章来自:http://www.cnblogs.com/syqlp/p/5460971.html
© 2021 jiaocheng.bubufx.com  联系我们
ICP备案:鲁ICP备09046678号-3