Monthly Archive:: 10月 2020

pytesseract 中image_to_data的C++实现

GetTSVText是Tesseract提供的在C++中可以获取TSV格式输出的函数,但其返回结果是字符串。那么在C++中是否能实现类似pytesseract中image_to_data DICT输出的函数,能便捷获取识别结果的各项信息呢?本文将分享如何用GetTSVText实现该功能。

OpenCV4.5.0基于深度学习的文本和数字识别示例

OpenCV 4.5.0已发布,其中【基于深度学习的文本和数字识别示例】是新版本的重大改进之一,它也是GSoC2020的成果之一。本文记录该项目相关示例OpenCV 4.5.0/samples/dnn/text_detection.py的测试方法与测试结果。

影响pytesseract识别结果的几项设定

pytesseract中PSM(Possible modes for page layout analysis)不同的设置对识别结果有怎样的影响?pytesseract中黑白名单如何设置?tesseract输入图像是否需要二值化?本文主要记录这三个问题的一些个人见解。

FastLineDetectors opencv-contrib python

cv::ximgproc::FastLineDetectors是opencv-contrib中用于检测直线的模块,该方法能在较短时间内获得精度较高的直线检测结果,且不需要调节参数。本文介绍该功能的使用方法其输出结果剖析。
Fork me on GitHub