pytesseract image_to_data检测并定位图片中的文字

pytesseract是用python包装Google Tesseract-OCR引擎的OCR工具,它通过调用系统中安装的tesseract.exe来识别图片中的文字并以多种格式进行输出。本文将记录如何使用pytesseract中image_to_data定位图片中的文字,以及该函数输出数据的格式详解。

Measure width of finger in an image with OpenCV

一只修长的手与一枚安静的硬币同框,已知硬币的直径,用opencv来测量五只手指的宽度和长度,如下动图所示。本文介绍此测量方式的实现方法。

Google Colab+ TensorFlow2.x-YOLOv3 训练自定义数据库

Google Colab可以免费使用Tesla K80 GPU + 15G免费空间。在Intel(R) Core(TM) i7-8550U CPU 8G RAM的无GPU的笔记本中,需要14个小时的TensorFlow2.x-YOLOv3 自定义数据库的训练,在Google Colab Tesla K80 GPU 仅需要35分钟可训练完成。

TensorFlow2.x-YOLOv3训练自定义数据库

本文记录如何用TensorFlow2.x-YOLOv3训练自定义数据库。训练使用TensorFlow-cpu 2.2,在Intel(R) Core(TM) i7-8550U CPU 8G RAM的笔记本中完成,训练artelab图集427张图的时间约为14个小时电脑,供参考。

TensorFlow2.x-YOLOv3在Win10中运行Demo

TensorFlow2.x-YOLOv3是一个基于TensorFlow2.X版本实现的YOLO3仓库,支持训练和测试自己的数据库。要训练自己的数据库,首先要确认该仓库在当前环境下可以成功运行其demo,本文记录在Win10+Python3.6环境下成功运行demo的过程。

Install labelImg on Win10 + python3.6

labelImg是深度学习时标注图像的得力助手,可以生成PASCAL VOC格式的XML文档,也可以生成YOLO格式的txt文档。本文记录在Win10 + Python3.6环境下安装labelImg的过程及其用法,以及PASCAL VOC和YOLO文档格式中数据的意义。

Predict Age and Gender according the deteced faces with CNN and opencv

用CNN、HAAR检测视频,图像或摄像头中的人脸,用caffemodel、keras、tensorflow根据对检测到的人脸进行年龄和性别的预测,可以在命令行菜单中选择检测源和检测模型,后续可以简便的扩展更多检测模型,只需opencv,Python,keras就可以试玩,快来围观。

Install keras and tensorflow cpu on Windows

Keras是基于 Python 的深度学习库,Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。本文记录在Windows10环境下安装keras和tensorflow cpu版本的过程。

Train Tesseract LSTM methods Comparison

近期整理了一系列关于train tesseract LSTM的文章,Train Tesseract LSTM with make, Train Tesseract LSTM with tesstrain.sh,该如何从中选择适合自己的方案呢?本文记录方案选择的基本原则及各种方案的异同。

Train Tesseract LSTM with tesstrain.sh on Windows

tesstrain.sh是How to use the tools provided to train Tesseract 4.00举例用的训练工具,主要用于训练各类语言的新字体,来源于Tesseract源码(Tesseract/src/training)。经过验证,tesstrain.sh在Windows10下可用,本文介绍在Windows下使用tesstrain.sh训练新字体的步骤,文中使用的训练文件已上传至tesstrainsh-win。
Fork me on GitHub