Monthly Archive:: 5月 2022
2022年5月5日
Tesseract5 fine tune Chinese character

在Train Tesseract LSTM with tesstrain.sh on Windows中,有网友提到在Github/Tesseract5中下载的chi_sim.traindata无法识别"垤,箐,勐"等较为生僻的文字,我们是否能自行对chi_sim.traindata进行Fine Tune呢?网友提出这个问题时,我用自己编译的Tesseract4版本尝试Fine tune失败,最近用Tesseract5和tesstrain的makefile训练成功。