借助于jTessBoxEditor软件能够提高Tesseract-OCR文字识别准确率,通过jTessBoxEditor的不断训练,使得Tesseract-OCR文字识别准确率得到极大的提高。
使用方法
jTessBoxEditor的运行环境为JAVA虚拟机,teesseract智能图片识别软件的训练框架,不需要安装直接解压即可,不过要事先安装一个jar包jdk-8u101-windows-x64虚拟机。
用jTessBoxEditor自动训练3500常用汉字
打开jTessBoxEditor图形化界面
(1)点击TIFF/BoxGenerator按钮
(2)将3500汉字copy到空白区域
(3)选择文件夹:(自己创建文件夹名字随意,我的是在F盘创建的)
(4)命名(自己随意命名,比如我的是haha)
(5) 选择自己药训练的字体(比如我的是宋体9pt)
(6)然后点击Generate按钮生成tif和box文件
(7)点击Trainer按钮
(8)打开之前创建的文件夹
(9)Language那里需要改名字(改成与第四步一样的名字,我的是haha)
(10)选择Train with Existing Box
(11)然后点击run
(12)成功后:
?推荐使用第三方专业下载工具下载本站软件,使用 WinRAR v3.10 以上版本解压本站软件。
?如果这个软件总是不能下载的请点击报告错误,谢谢合作!!
?下载本站资源,如果服务器暂不能下载请过一段时间重试!
?如果遇到什么问题,请到本站论坛去咨寻,我们将在那里提供更多 、更好的资源!
?本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。