openCV Archive

OpenVINO+Win10安装及环境配置攻略

OpenVINO主要包括模型优化器(Model Optimizer)和推理引擎(Inference engine)两部分。模型优化器负责将各种格式的深度神经网络模型转换成统一的自定义格式,并在转换过程中进行模型优化;推理引擎接受经过模型优化器转换并优化的网络模型,为Intel的各种计算设备提供高性能的神经网络推理运算。本文主要记录在Win10 X64+VS2019+Python3.6环境下的安装过程,以及安装过程中的注意事项。

pytesseract 中image_to_data的C++实现

GetTSVText是Tesseract提供的在C++中可以获取TSV格式输出的函数,但其返回结果是字符串。那么在C++中是否能实现类似pytesseract中image_to_data DICT输出的函数,能便捷获取识别结果的各项信息呢?本文将分享如何用GetTSVText实现该功能。

OpenCV4.5.0基于深度学习的文本和数字识别示例

OpenCV 4.5.0已发布,其中【基于深度学习的文本和数字识别示例】是新版本的重大改进之一,它也是GSoC2020的成果之一。本文记录该项目相关示例OpenCV 4.5.0/samples/dnn/text_detection.py的测试方法与测试结果。

FastLineDetectors opencv-contrib python

cv::ximgproc::FastLineDetectors是opencv-contrib中用于检测直线的模块,该方法能在较短时间内获得精度较高的直线检测结果,且不需要调节参数。本文介绍该功能的使用方法其输出结果剖析。

Predict Age and Gender according the deteced faces with CNN and opencv

用CNN、HAAR检测视频,图像或摄像头中的人脸,用caffemodel、keras、tensorflow根据对检测到的人脸进行年龄和性别的预测,可以在命令行菜单中选择检测源和检测模型,后续可以简便的扩展更多检测模型,只需opencv,Python,keras就可以试玩,快来围观。

OpenCV dnn text_detection

本文记录opencv自带的DNN模块中其中一个范例的测试记录和学习笔记,该范例用于检测自然场景文本,功能及其强大,按要求加载训练模型以后,不需要更改任何参数,可检测多种语言自然场景中的的文本。该范例源代码路径如下https://github.com/opencv/opencv/blob/master/samples/dnn/text_detection.cpp.

SIFT/SURF/FlannBasedMatcher在某生产线视觉系统中的应用

曾经UPWORK上看到过某生产线某环节的应用需求: 1. 在挂钩生产线某一个环节中,需要将一个金属徽章正确的贴在一个空白的挂钩上。 2. 传送带将金属徽章移入工作区。 工作区将是由玻璃制成,玻璃下方有一个朝上的摄像头,用于捕获进入工作区的徽章图像, 徽章进入工作区的位置与方向均随机。 3. 视觉系统根据摄像头捕获的图像,在现有的资料库中查找产品编号,并计算出徽章的中心点坐标及其相对旋转角度。 4. 视觉系统将徽章的中心点坐标和旋转角度发送给机器人,机器人将空白的挂钩盖移动到正确的角度和位置,并将徽章和挂钩连接在一起。 5. 视觉系统将产品编号发送给系统,系统打印好当前产品的条形码标签。组装好的挂钩盖离开机器人单元后,操作员将标签贴在成品上。 6. 视觉系统查找单张图像产品编码以及计算徽章中心点坐标和旋转角度的时间应该在1s以内。 7. 该视觉系统可随时扩充现有资料库,便于后续添加更多的徽章设计图像。

将opencv Mat格式的图像数据写入excel表格

在学习opencv的过程中,我经常想了解当前图像某个区域的具体像素值及其分布规律。如果将数据打印在控制台中,会觉得眼花缭乱,很难找到想关注的内容。但如果可以将其输出到excel表格中,查看起来就会方便很多,辅以简单的VB程序,还可以让不同的数据显示不同的颜色,数据查看会更加直观。本文记录将Mat图像写入excel表格和为excel表格数值赋颜色的方法,把我认为好用的工具推荐给大家。

connectedComponentsWithStats在汉字定位中的应用

opencv3.0及以上版本中有一个名为connectedComponentsWithStats的函数,该函数不仅可以得到输入图像的连通域的标记图,还可以返回图像中每一个连通域外接矩形的左上角坐标,宽和高,以及连通域包含的像素总数,连通域的质心等等重要属性。在《基于笔画宽度转换(SWT)和连通域的汉字检测方法》一文中提到使用connectedComponentsWithStats结合SWT来定位复杂背景中的汉字,本文将在该文章的基础上详述connectedComponentsWithStats在汉字定位中的应用。

基于笔画宽度转换(SWT)和连通域的汉字检测方法

在upwork上看到一个有意思的项目,该项目要求处理一组图片,该组图片分为两部分,A区有一部分区域包含3~5个汉字,白底黑字,其他没有字的部分为黑色背景;B区背景色彩斑斓,前景随机分布着A区的汉字。处理要求是依据A区汉字的顺序分别找到其在B区的位置,并识别A区的汉字。
Fork me on GitHub