Author Archive

Train Tesseract LSTM with tesstrain.sh on Windows

tesstrain.sh是How to use the tools provided to train Tesseract 4.00举例用的训练工具,主要用于训练各类语言的新字体,来源于Tesseract源码(Tesseract/src/training)。经过验证,tesstrain.sh在Windows10下可用,本文介绍在Windows下使用tesstrain.sh训练新字体的步骤,文中使用的训练文件已上传至tesstrainsh-win。

How the makefile in tesstrain-win work

tesstrain-win可以在Windows下,根据图像及其对应的文本进行Tesseract LSTM with make的训练。它来源于Tesseract-ocr/tesstrain,makefile以及文件结构有一些改动。本文以tesstrain-win中的makefile为例,记录Train Tesseract LSTM with make训练流程与工作原理。

Train Tesseract LSTM with make on Windows

The repository tesseract-ocr/tesstrain on github could implement LSTM training. It is powerful, simple and easy to use. But it only works in Linux. To make the project work in Windows, I made some changes to the makefile and file structure, and the modified project is tesstrain-win.This article mainly records the use of tesstrain-win and its

Train Tesseract LSTM with make on Windows

Train Tesseract LSTM with make 在github上对应的项目为tesseract-ocr/tesstrain,该项目用命令行来实现LSTM的训练,功能强大,简洁易用,但是它仅支持Linux下运行。为了让tesseract-ocr / tesstrain能在Windows中运行,我对其中的makefile和文件结构进行了一些改动,修改后的项目请参考tesstrain-win。本文主要记录tesstrain-win的使用方法及其改造过程。

Install Cygwin on Win10 for makefile

Cygwin is a UNIX-like simulation environment running on the windows platform that can interoperate with Windows, and Cygwin mounts Windows disks to/cygdrive, such as the c disk is /cygdrive/c, d disk is /cygdrive/d.Cygwin offers package management tools to install/uninstall packages on demand, and a minimal Cygwin system that can run requires only a few tens

Install Cygwin on Win10 for makefile

Cygwin是一个在windows平台上运行的类UNIX模拟环境,可以与Windows互操作,Cygwin把Windows的磁盘挂载到/cygdrive下,例如c盘就是/cygdrive/c、d盘就是/cygdrive/d。Cygwin提供了包管理工具,可按需安装/卸载软件包,一个能运行起来的最小Cygwin系统只需要几十M,但完全的Cygwin系统需要几十GB。我安装cygwin的目的是为了在Win10中运行tesseract-ocr/tesstrain中的makefile,暂时不需要其他功能,因此本攻略将记载安装运行makefile的必要工具的过程。

Win10 Tesseract4.1 LSTM training

本文记录win10 x64 Tesseract4.1 LSTM training的两种方法,均属于Fine Tune。一种是使用待训练字库 + 待训练文本 + text2image + lstmtraining,另一种是待训练图像 + jTessBoxEditor + lstmtraining。这两种方式训练时的主要差异是准备.box和.tif文件的方法不一样,其他部分基本相同。

OpenCV dnn text_detection

本文记录opencv自带的DNN模块中其中一个范例的测试记录和学习笔记,该范例用于检测自然场景文本,功能及其强大,按要求加载训练模型以后,不需要更改任何参数,可检测多种语言自然场景中的的文本。该范例源代码路径如下https://github.com/opencv/opencv/blob/master/samples/dnn/text_detection.cpp.

SIFT/SURF/FlannBasedMatcher在某生产线视觉系统中的应用

曾经UPWORK上看到过某生产线某环节的应用需求: 1. 在挂钩生产线某一个环节中,需要将一个金属徽章正确的贴在一个空白的挂钩上。 2. 传送带将金属徽章移入工作区。 工作区将是由玻璃制成,玻璃下方有一个朝上的摄像头,用于捕获进入工作区的徽章图像, 徽章进入工作区的位置与方向均随机。 3. 视觉系统根据摄像头捕获的图像,在现有的资料库中查找产品编号,并计算出徽章的中心点坐标及其相对旋转角度。 4. 视觉系统将徽章的中心点坐标和旋转角度发送给机器人,机器人将空白的挂钩盖移动到正确的角度和位置,并将徽章和挂钩连接在一起。 5. 视觉系统将产品编号发送给系统,系统打印好当前产品的条形码标签。组装好的挂钩盖离开机器人单元后,操作员将标签贴在成品上。 6. 视觉系统查找单张图像产品编码以及计算徽章中心点坐标和旋转角度的时间应该在1s以内。 7. 该视觉系统可随时扩充现有资料库,便于后续添加更多的徽章设计图像。

Tesseract4.0 APIExamples 验证实录与函数解析

本文主要记录Tesseract4.0 APIExamples中的Result iterator example,Example of iterator over the classifier choices for a single symbol,Example to get confidence for alternative symbol choices per character for LSTM这三个示例的运行结果和相关函数的解析。测试均在Tessrect4.0+VS2017+Win10的条件下进行,如果对于安装有疑问,请参考这里: Tesseract4.0+VS2017+win10源码编译攻略
Fork me on GitHub