pytesseract 中image_to_data的C++实现

GetTSVText是Tesseract提供的在C++中可以获取TSV格式输出的函数,但其返回结果是字符串。那么在C++中是否能实现类似pytesseract中image_to_data DICT输出的函数,能便捷获取识别结果的各项信息呢?本文将分享如何用GetTSVText实现该功能。

OpenCV4.5.0基于深度学习的文本和数字识别示例

OpenCV 4.5.0已发布,其中【基于深度学习的文本和数字识别示例】是新版本的重大改进之一,它也是GSoC2020的成果之一。本文记录该项目相关示例OpenCV 4.5.0/samples/dnn/text_detection.py的测试方法与测试结果。

影响pytesseract识别结果的几项设定

pytesseract中PSM(Possible modes for page layout analysis)不同的设置对识别结果有怎样的影响?pytesseract中黑白名单如何设置?tesseract输入图像是否需要二值化?本文主要记录这三个问题的一些个人见解。

FastLineDetectors opencv-contrib python

cv::ximgproc::FastLineDetectors是opencv-contrib中用于检测直线的模块,该方法能在较短时间内获得精度较高的直线检测结果,且不需要调节参数。本文介绍该功能的使用方法其输出结果剖析。

pytesseract image_to_osd文字方向与文字编码检测

image_to_osd中osd的全称是Orientation and script detection,image_to_osd的用途是检测图像中文字方向和字符编码类型,同时会给出相应检测结果的置信度。本文介绍pytesseract中函数image_to_osd输出内容的意义及其用法。

pytesseract image_to_data检测并定位图片中的文字

pytesseract是用python包装Google Tesseract-OCR引擎的OCR工具,它通过调用系统中安装的tesseract.exe来识别图片中的文字并以多种格式进行输出。本文将记录如何使用pytesseract中image_to_data定位图片中的文字,以及该函数输出数据的格式详解。

Measure width of finger in an image with OpenCV

一只修长的手与一枚安静的硬币同框,已知硬币的直径,用opencv来测量五只手指的宽度和长度,如下动图所示。本文介绍此测量方式的实现方法。

Google Colab+ TensorFlow2.x-YOLOv3 训练自定义数据库

Google Colab可以免费使用Tesla K80 GPU + 15G免费空间。在Intel(R) Core(TM) i7-8550U CPU 8G RAM的无GPU的笔记本中,需要14个小时的TensorFlow2.x-YOLOv3 自定义数据库的训练,在Google Colab Tesla K80 GPU 仅需要35分钟可训练完成。

TensorFlow2.x-YOLOv3训练自定义数据库

本文记录如何用TensorFlow2.x-YOLOv3训练自定义数据库。训练使用TensorFlow-cpu 2.2,在Intel(R) Core(TM) i7-8550U CPU 8G RAM的笔记本中完成,训练artelab图集427张图的时间约为14个小时电脑,供参考。

TensorFlow2.x-YOLOv3在Win10中运行Demo

TensorFlow2.x-YOLOv3是一个基于TensorFlow2.X版本实现的YOLO3仓库,支持训练和测试自己的数据库。要训练自己的数据库,首先要确认该仓库在当前环境下可以成功运行其demo,本文记录在Win10+Python3.6环境下成功运行demo的过程。
Fork me on GitHub