Author Archive

TensorFlow2.x-YOLOv3在Win10中运行Demo

TensorFlow2.x-YOLOv3是一个基于TensorFlow2.X版本实现的YOLO3仓库,支持训练和测试自己的数据库。要训练自己的数据库,首先要确认该仓库在当前环境下可以成功运行其demo,本文记录在Win10+Python3.6环境下成功运行demo的过程。

Install labelImg on Win10 + python3.6

labelImg是深度学习时标注图像的得力助手,可以生成PASCAL VOC格式的XML文档,也可以生成YOLO格式的txt文档。本文记录在Win10 + Python3.6环境下安装labelImg的过程及其用法,以及PASCAL VOC和YOLO文档格式中数据的意义。

Predict Age and Gender according the deteced faces with CNN and opencv

用CNN、HAAR检测视频,图像或摄像头中的人脸,用caffemodel、keras、tensorflow根据对检测到的人脸进行年龄和性别的预测,可以在命令行菜单中选择检测源和检测模型,后续可以简便的扩展更多检测模型,只需opencv,Python,keras就可以试玩,快来围观。

Install keras and tensorflow cpu on Windows

Keras是基于 Python 的深度学习库,Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。本文记录在Windows10环境下安装keras和tensorflow cpu版本的过程。

Train Tesseract LSTM methods Comparison

近期整理了一系列关于train tesseract LSTM的文章,Train Tesseract LSTM with make, Train Tesseract LSTM with tesstrain.sh,该如何从中选择适合自己的方案呢?本文记录方案选择的基本原则及各种方案的异同。

Train Tesseract LSTM with tesstrain.sh on Windows

tesstrain.sh是How to use the tools provided to train Tesseract 4.00举例用的训练工具,主要用于训练各类语言的新字体,来源于Tesseract源码(Tesseract/src/training)。经过验证,tesstrain.sh在Windows10下可用,本文介绍在Windows下使用tesstrain.sh训练新字体的步骤,文中使用的训练文件已上传至tesstrainsh-win。

How the makefile in tesstrain-win work

tesstrain-win可以在Windows下,根据图像及其对应的文本进行Tesseract LSTM with make的训练。它来源于Tesseract-ocr/tesstrain,makefile以及文件结构有一些改动。本文以tesstrain-win中的makefile为例,记录Train Tesseract LSTM with make训练流程与工作原理。

Train Tesseract LSTM with make on Windows

Train Tesseract LSTM with make 在github上对应的项目为tesseract-ocr/tesstrain,该项目用命令行来实现LSTM的训练,功能强大,简洁易用,但是它仅支持Linux下运行。为了让tesseract-ocr / tesstrain能在Windows中运行,我对其中的makefile和文件结构进行了一些改动,修改后的项目请参考tesstrain-win。本文主要记录tesstrain-win的使用方法及其改造过程。

Install Cygwin on Win10 for makefile

Cygwin是一个在windows平台上运行的类UNIX模拟环境,可以与Windows互操作,Cygwin把Windows的磁盘挂载到/cygdrive下,例如c盘就是/cygdrive/c、d盘就是/cygdrive/d。Cygwin提供了包管理工具,可按需安装/卸载软件包,一个能运行起来的最小Cygwin系统只需要几十M,但完全的Cygwin系统需要几十GB。我安装cygwin的目的是为了在Win10中运行tesseract-ocr/tesstrain中的makefile,暂时不需要其他功能,因此本攻略将记载安装运行makefile的必要工具的过程。

Win10 Tesseract4.1 LSTM training

本文记录win10 x64 Tesseract4.1 LSTM training的两种方法,均属于Fine Tune。一种是使用待训练字库 + 待训练文本 + text2image + lstmtraining,另一种是待训练图像 + jTessBoxEditor + lstmtraining。这两种方式训练时的主要差异是准备.box和.tif文件的方法不一样,其他部分基本相同。
Fork me on GitHub