Tesseract3.04 和opencv3.1在条形码识别中的应用

商品条码是由一组按一定规则排列的条、空及对应字符(阿拉伯数字)所组成。条码用于识读设备的扫描识读;对应字符由一组阿拉伯数字组成,供人们直接识读或手动输入数据。这一组条、空和相应的字符所表示的信息是相同的。本文提及的条形码识别程序BarcodeOCR用于识别条形码中阿拉伯数字。

在VS2013 C++工程中运行Tesseract APIExample

Tesseract在Github中有一项名为APIExample的wiki,该wiki的作用是提供在C++中使用tesseract-ocr API的范例。若这些范例可以正常运行,那么可以认为tesseract-ocr以及相关依赖项已正确安装。本文介绍Tesseract APIExample其中一个范例的正确的打开方式(该方法适用于在opencv工程中使用Tesseract)。

Visual studio 2013中编译Tesseract3.04源码记录

我曾在VS2013的C#工程中试用过Tesseract3.04,但是要在C++工程中使用Tesseract3.04,就需要自行编译Tesseract3.04源码。本文记录在Visual studio 2013中编译Tesseract3.04源码的过程和注意事项。

sift & surf & bag-of-words 在目标识别中的应用详解

SIFT和SURF的每一个特征点的描述符维度固定,但不同图像获取的特征点数量不一致,从而导致不同图像的特征维度不一致。而 SVM模型训练时,要求每个样本的特征维度相同。如何实现用SIFT和SURF特征点来训练SVM模型呢?这是我在opencv3.1 SVM sample_HOG特征在车牌判断中的应用 一文中挖的坑,本文为填此坑而生,欢迎围观和指教。

bag of words classification实现图像分类的原理详解

bag of words模型是信息检索领域常用的文档表示方法。在信息检索时,bag of words模型将一个文档仅看作是若干个词汇的集合,文档中每个单词的出现都是独立的,不依赖于其他单词,语法和词法。bag of words模型应用于图像时,需要从每类图像中提取视觉词汇构造单词表,用单词表中的词汇来表示图像。opencv的例程bag-of-words classification演示了bag of words模型在图像中的应用,下面我们根据该例程的执行顺序来学习其如何实现图像分类。

bagofwords_classification的一种正确的打开方式

bagofwords_classification是opencv_contrib中用bags of words对图像进行分类的一个范例,其测试数据是PASCAL VOC。PASCAL VOC为图像识别和分类提供了一套标准化的优秀数据集,是验证各种精妙算法性能的标准评估系统。本文记录bagofwords_classification.cpp的运行方法和注意事项。

opencv3.1 SVM sample_HOG特征在车牌判断中的应用

在开源的车牌识别系统EasyPR中,用SVM(支持向量机)模型甄选出候选车牌中真正的车牌。目前EasyPR1.4的SVM模型输入的是LBP特征,作者提及后续会考虑增加HOG和SIFT特征。据此思路,我用HOG/SIFT/SURF特征作为SVM模型的输入进行了初步验证,在此记录训练方法和数据。

opencv3.1 svm(支持向量机)使用心得

SVM是opencv中一个内置的机器学习类,在使用该类时,我们需要接触到的是train(训练数据)/trainAuto(自动训练数据)/predict(对未知数据进行预测)等三个函数。本文以这三个函数为中心记录一些SVM(支持向量机)的使用心得。

opencv3.1 SURF特征点算法说明与示例

SURF (Speeded Up Robust Features)是一种具有鲁棒性的局部特征检测算法。CSDN的博主zhaocj写的Opencv2.4.9源码分析——SURF对SURF算法分析的非常透彻,建议想学习SURF算法原理的同学去研读。本文从应用角度来记录SURF算法,并给出相应的范例。

opencv3.1的SIFT特征检测参数图文详解

SIFT算法的实现过程大致如下:对源图像进行高斯模糊处理,根据源图尺寸和相关设定参数生成图像的高斯金字塔和高斯差分金字塔(DOG尺度空间),在DOG尺度空间中搜索特征点,计算尺度,构建特征描述子。本文以SIFT的参数为主线来尝试说明SIFT算法的原理。
Fork me on GitHub