Tesseract Archive

OCRMyPDF在win10+python3.6中被调用

OCRmyPDF是基于Tesseract和python3的应用程序,它可以将不可复制粘贴的PDF文件转换为可以复制粘贴的PDF文件。OCRmyPDF的部分功能可以在python中调用,本文将介绍如何在win10+python3.6中调用OCRmyPDF。

pytesseract 中image_to_data的C++实现

GetTSVText是Tesseract提供的在C++中可以获取TSV格式输出的函数,但其返回结果是字符串。那么在C++中是否能实现类似pytesseract中image_to_data DICT输出的函数,能便捷获取识别结果的各项信息呢?本文将分享如何用GetTSVText实现该功能。

基于笔画宽度转换(SWT)和连通域的汉字检测方法

在upwork上看到一个有意思的项目,该项目要求处理一组图片,该组图片分为两部分,A区有一部分区域包含3~5个汉字,白底黑字,其他没有字的部分为黑色背景;B区背景色彩斑斓,前景随机分布着A区的汉字。处理要求是依据A区汉字的顺序分别找到其在B区的位置,并识别A区的汉字。

C#实现图像竖直投影

近期的学习重点的是如何让Tesseract识别粘连倾斜的字符(如下图所示),把这种图片直接丢给Tesseract肯定是不行的,我需要先将图片中的字符分开,然后再将倾斜的字符摆正,然后才可以给Tesseract呈上。那么现在第一个问题来了,怎样才能正确的将粘连字符分割呢?相关参考资料显示,通过竖直投影直方图的投影极小值,再辅以滴水算法的起始滴落点即可实现正确率较高的分割。

Tesseract “托管”已退出_解决方案

Tesseract"托管"已退出的现象出现在Vs2008建立的控制台应用程序中,具体表现为:编译过程中不报错,运行时有一个黑框一闪而过,输出框显示”‘托管’已退出,返回值为1“,在ocr.Init之后的语句添加断点时无法正常进入调试状态。
Fork me on GitHub