Tesseract5 fine tune Chinese character

在Train Tesseract LSTM with tesstrain.sh on Windows中,有网友提到在Github/Tesseract5中下载的chi_sim.traindata无法识别"垤,箐,勐"等较为生僻的文字,我们是否能自行对chi_sim.traindata进行Fine Tune呢?网友提出这个问题时,我用自己编译的Tesseract4版本尝试Fine tune失败,最近用Tesseract5和tesstrain的makefile训练成功。

Train traindata to OCR fraction with tesseract4.1

Tesseract的equ.traineddata不能识别下图中的分数,那么我们是否能自己训练一个可以识别分数的traineddata呢?在过去的文章中,我们提到过Tesseract有Train Tesseract LSTM with make和 Train Tesseract LSTM with tesstrain.sh的方式来训练自定义的traineddata文件。

RotatedRect和minAreaRect源代码学习笔记

我们在使用opencv处理图像的轮廓时,通常会用到RotatedRect。RotatedRect不是横平竖直的矩形,每个RotatedRect由中心点(质心)、每条边的长度(由 Size2f 结构表示)和以度为单位的旋转角度指定。

如何在python中使用tesserocr调用tesseract C++ API

tesserocr是 Tesseract C++ API的 python封装;我们所熟知的pytesseract是tesseract-ocr CLI的python封装,CLI即Command Line Interface。本文将主要介绍如何在win10下安装与使用tesserocr。

OCRMyPDF在win10+python3.6中被调用

OCRmyPDF是基于Tesseract和python3的应用程序,它可以将不可复制粘贴的PDF文件转换为可以复制粘贴的PDF文件。OCRmyPDF的部分功能可以在python中调用,本文将介绍如何在win10+python3.6中调用OCRmyPDF。

OpenCV Dnn调用OpenVINO security_barrier_camera模型检测并识别车牌

在OpenVINO+Win10安装及环境配置攻略一文中有一个Security Barrier Camera Demo 应用程序,它调用了3个模型,可以检测车辆,车牌,车辆颜色以及类型,并且识别车牌。本文分享如何用OpenCV的DNN来调用Security Barrier Camera Demo 中的模型实现检测并识别车牌。

OpenCV调用OpenVINO模型vehicle-license-plate-detection-barrier检测车牌

在OpenVINO+Win10安装及环境配置攻略中,我们通过调用相关模型检测并识别车牌及检测车身颜色。本文将分享如何在OpenCV下调用OpenVINO的车牌检测模型vehicle-license-plate-detection-barrier检测车牌并分析该模型的检测输出数据。

Contour Properties in findContours

OpenCV中的轮廓(Contours)是形状分析以及对象检测和识别的非常有用的工具,我们可以通过函数findContours获取。今天我们继续来学习Contours的相关的常用函数boundingRect,minAreaRect,contourArea,convexHull。

Contours Hierarchy and order in OpenCV

Opencv中的轮廓是形状分析以及对象检测和识别的非常有用的工具。本文将记录findContours函数,在不同的轮廓检索模式(Contour Retrieval Mode)下,所得到的轮廓的层次结构,即Contours中的父子关系,以及轮廓的排序规则。

OpenVINO+Win10安装及环境配置攻略

OpenVINO主要包括模型优化器(Model Optimizer)和推理引擎(Inference engine)两部分。模型优化器负责将各种格式的深度神经网络模型转换成统一的自定义格式,并在转换过程中进行模型优化;推理引擎接受经过模型优化器转换并优化的网络模型,为Intel的各种计算设备提供高性能的神经网络推理运算。本文主要记录在Win10 X64+VS2019+Python3.6环境下的安装过程,以及安装过程中的注意事项。
Fork me on GitHub