Tesseract4.0+VS2017+win10源码编译攻略

本文记录以下内容:一,记录我目前在win10 X64和VS2017的环境下成功编译Tesseract4.0(目前最新的版本20180106)的一种方式;二,记录在VS2017 C++工程中调用Tesseract4.0的方法;三,记录编译和调用Tesseract4.0过程中踩到的坑和相应的解决方案或看法。

将opencv Mat格式的图像数据写入excel表格

在学习opencv的过程中,我经常想了解当前图像某个区域的具体像素值及其分布规律。如果将数据打印在控制台中,会觉得眼花缭乱,很难找到想关注的内容。但如果可以将其输出到excel表格中,查看起来就会方便很多,辅以简单的VB程序,还可以让不同的数据显示不同的颜色,数据查看会更加直观。本文记录将Mat图像写入excel表格和为excel表格数值赋颜色的方法,把我认为好用的工具推荐给大家。

connectedComponentsWithStats在汉字定位中的应用

opencv3.0及以上版本中有一个名为connectedComponentsWithStats的函数,该函数不仅可以得到输入图像的连通域的标记图,还可以返回图像中每一个连通域外接矩形的左上角坐标,宽和高,以及连通域包含的像素总数,连通域的质心等等重要属性。在《基于笔画宽度转换(SWT)和连通域的汉字检测方法》一文中提到使用connectedComponentsWithStats结合SWT来定位复杂背景中的汉字,本文将在该文章的基础上详述connectedComponentsWithStats在汉字定位中的应用。

基于笔画宽度转换(SWT)和连通域的汉字检测方法

在upwork上看到一个有意思的项目,该项目要求处理一组图片,该组图片分为两部分,A区有一部分区域包含3~5个汉字,白底黑字,其他没有字的部分为黑色背景;B区背景色彩斑斓,前景随机分布着A区的汉字。处理要求是依据A区汉字的顺序分别找到其在B区的位置,并识别A区的汉字。

基于笔画宽度转换的文字检测(SWT)方法

基于笔画宽度转换的文字检测(SWT)​方法较普遍的用于自然场景的文字检测。本文主要介绍Github上一个基于opencv2.4+Boost实现的基于笔画宽度转换的文字检测(SWT)​项目,包括其检测效果演示和在windows上的编译方法。

通过CLR在VC#项目中调用Opencv C++代码

在VC#项目中调用Opencv c++代码应该是一个比较常见的需求。C#有丰富的UI,而VC++ opencv则几乎没有UI。C#中虽然可以支持Emgucv,但是与原生态的opencv相比,我更愿意选择opencv。Use OpenCV C++ codes in a VC# project — solution of creating a managed CLR wrapper一文中讲到了在VC#项目中调用Opencv C++代码的方法,本文记录我验证此文的过程,翻译原文为主,有部分改动,感谢原作者。

VS2013_CMake_opencv3.1动态库与静态库的配置与编译

通常我们的OpenCV项目在学习或研究阶段,使用动态库足矣,当OpenCV程序需要发布时,尤其是程序需要拷到没有OpenCV环境的机器上运行时,静态库文件就会比较便捷。本文记录OpenCV3.1源码编译动静态库的方法和注意事项。

Git Shell常用命令和三种错误的处理方式

说来惭愧,对于我而言,Git Shell是Visual Studio Tools for Git的备用工具。近期因为种种原因,开始尝试使用Git shell来将本地仓库的修改内容更新至远程仓库,在使用过程中困难重重,因此在这里整理了Git Shell常用操作的命令供后续查阅,另外记录了本次尝试遇到的错误及其解决方案,供需要的同学参考。

HOG + Linear SVM detector实现目标物体检测

HOG + Linear SVM detector给我们的第一印象是用于行人检测,但事实上它们可用于任意目标物体的检测。今天我要跟大家分享的是用HOG + Linear SVM detector来检测传送带中的轮胎,并用LBP+SVM对轮胎进行分类。

Tesseract3.04 和opencv3.1在条形码识别中的应用

商品条码是由一组按一定规则排列的条、空及对应字符(阿拉伯数字)所组成。条码用于识读设备的扫描识读;对应字符由一组阿拉伯数字组成,供人们直接识读或手动输入数据。这一组条、空和相应的字符所表示的信息是相同的。本文提及的条形码识别程序BarcodeOCR用于识别条形码中阿拉伯数字。
Fork me on GitHub