使用Google开源tesseract OCR用语言库报allow_blob_division解决方案

在使用语音库时候遇到报错：allow_blob_division，例如使用chi_sim.traineddata;
在chi_sim.traineddata文件目录下,使用命令行执行：

combine_tessdata -e chi_sim.traineddata chi_sim.config

执行完后，在目录下出现chi_sim.config的文件，打开该文件；
在allow_blob_division F这一行的前面加#，注释掉

即：# allow_blob_division F

然后，在执行命令行：
combine_tessdata -o chi_sim.traineddata chi_sim.config

到此在使用 chi_sim.traineddata文件就不会报read_params_file: parameter not found: allow_blob_division

当然，要使用上面的命令行，需要安装Tesseract-OCR

文章来自：http://www.cnblogs.com/syqlp/p/5460971.html