使用Tesseract-OCR进行文字识别 | 冰蓝记录思考的地方

健康工作—智能久坐提醒软件学习DQN（Deep Q-Learning Network）高效工作—优雅的阅读微信公众号配置SSD进行目标检测豆瓣离线备份-Shell脚本 Ubuntu下搭建CUDA开发环境高效工作—快捷键整理链家爬虫 Python的文件操作与输入输出 Python的映射和集合类型 Python序列相关知识总结使用Wget下载整个网站 Python实现CSDN博客的完整备份嵌入式ARM下常用环境的配置及常见问题汇总 Ubuntu下常用软件的安装使用及常见问题汇总自己造的轮子们开源多线程编程中的几个概念按拍摄日期一键归类照片 Python 装机相关问题汇总 Normalized Cut的C++源码 Windows下Cygwin的使用 Windows系统下的一些经验技巧车牌检测及识别 OpenALPR Theano利用GPU进行深度学习加速的配置及使用 Upper-Body Detection源码配置及使用 Linux下Opencv的安装及配置使用 Linux下Matlab的安装及配置使用 Opencv交叉编译及Arm平台移植 ICF，DPM等行人检测算法实践 Python使用过程中常见问题汇总 Git常用命令总结正则表达式及在Python中的使用利用UDP协议进行图像传输使用Tesseract-OCR进行文字识别移植Wifi模块RT3070到ARM平台 Linux下PC版及ARM版QT环境配置，ARM移植及触摸屏支持 Opencv使用时的常见问题汇总使用Latex的一些经验技巧汇总 C++使用时的常见问题汇总

与塞涅卡共进早餐：斯多葛哲学的人生艺术-读书简记生活的艺术家-读书简记看见孩子-读书简记秒懂金融-读书简记与巴菲特共进午餐时，我顿悟到的5个真理：探寻财富、智慧与价值投资的转变之旅-读书简记孩子的品格：写给父母的积极心理学-读书简记家有琴童-读书简记超越百岁：长寿的科学与艺术-读书简记千脑智能-读书简记禅与摩托车维修艺术-读书简记笔记的方法-读书简记心经抉隐-读书简记刷新：重新发现商业与未来-读书简记认知觉醒-读书简记真希望我父母读过这本书-读书简记模仿欲望-读书简记蛤蟆先生去看心理医生-读书简记置身事内：中国政府与经济发展-读书简记跑步圣经（第2版）-读书简记宇宙-读书简记十分钟冥想-读书简记当我谈跑步时，我谈些什么-读书简记乔布斯、禅与投资-读书简记掌控习惯-读书简记 AI未来进行式（李开复陈楸帆新书）-读书简记金钱心理学-读书简记被讨厌的勇气-读书简记思考的框架-读书简记身心合一的奇迹力量-读书简记零极限-读书简记投资最重要的事-读书简记语言学的邀请-读书简记更富有、更睿智、更快乐-读书简记管理的常识-读书简记卡片笔记写作法-读书简记大脑通信员：认识你的神经递质-读书简记规模-读书简记纳瓦尔宝典-读书简记卓有成效的管理者-读书简记贪婪的多巴胺-读书简记清醒的活-读书简记像哲学家一样生活：斯多葛哲学的生活艺术-读书简记你是你吃出来的-读书简记你可以跑的更快-读书简记丹尼尔斯经典跑步训练法-读书简记非暴力沟通-读书简记异类-读书简记稀缺-读书简记为什么要睡觉-读书简记事实-读书简记世界上最快乐的人-读书简记病毒学概览-读书简记免疫学概览-读书简记内观-读书简记沟通的艺术-读书简记你的生命有什么可能-读书简记演化的故事-读书简记经济学原理：宏观经济学分册-读书简记经济学原理：微观经济学分册-读书简记社会心理学-读书简记追寻记忆的痕迹-读书简记情绪-读书简记远见：如何规划职业生涯3阶段-读书简记存在主义心理治疗-读书简记 P·E·T父母效能训练-读书简记彼得·林奇的成功投资-读书简记 2015-2020美国居民膳食指南-读书简记中国居民膳食指南（2016）-读书简记批判性思维-读书简记代码大全-读书简记游戏力-读书简记成功，动机与目标-读书简记基因组：人种自传23章-读书简记 YOU身体使用手册-读书简记登天之梯-读书简记为什么学生不喜欢上学-读书简记请停止无效努力-读书简记麦肯基疗法-读书简记跟简七学理财-课程简记指数基金投资指南（2017中信版）-读书简记指数基金投资指南（2015雪球版）-读书简记让大脑自由：释放天赋的12条定律-读书简记养育的选择-读书简记 GPU高性能编程CUDA实战-读书简记百万富翁快车道-读书简记原则-读书简记穷查理宝典-读书简记 C++并发编程实战-读书简记哲学家们都干了些什么-读书简记 Effective C++-读书简记通往财富自由之路-读书简记 Linux命令行与Shell脚本编程大全-读书简记刻意练习-读书简记写给大家看的设计书-读书简记习惯的力量-读书简记好好学习-读书简记硅谷最受欢迎的情商课-读书简记富爸爸，穷爸爸-读书简记如何说孩子才会听，怎么听孩子才会说-读书简记阻力最小之路-读书简记 ProGit-读书简记思考：快与慢-读书简记 C语言深度剖析-读书简记编程珠玑-读书简记 Head First 设计模式-读书简记反脆弱-读书简记我的阅读书单小强升职记-读书简记观呼吸-读书简记黑客与画家-读书简记晨间日记的奇迹-读书简记如何高效学习-读书简记即兴的智慧-读书简记精力管理-读书简记 C++编程思想-读书简记拖延心理学-读书简记自控力-读书简记伟大是熬出来的-读书简记生命不能承受之轻-读书简记高效能人士的七个习惯-读书简记没有任何借口-读书简记一分钟的你自己-读书简记人生不设限-读书简记暗时间-读书简记

写在三十一岁-跳船简记最重要的投资挖掘好书神器-书海星空豆瓣图书TOP 999 豆瓣图书最受欢迎的TOP 999 挖掘好书神器-好书一下机器学习经典图书-排名榜编程经典图书-排名榜知乎上赞同数最高的999个回答活着，为了什么

RefineDet-论文简记 DenseNet-论文简记 TensorFlow实现生成对抗网络GAN-翻译 Mask RCNN-论文简记 Feature Pyramid Networks for Object Detection-论文简记目标检测之YOLOv2 目标检测之YOLO，SSD 目标检测之RCNN，SPP-NET，Fast-RCNN，Faster-RCNN ResNet的理解及其Keras实现 GoogLeNet的理解及其Keras实现 VGGNet的理解及其Keras实现 AlexNet的理解及其Keras实现理解SVM算法最小二乘法的参数估计视觉中的二维射影变换及多视角几何强化学习与马尔科夫决策过程理解EM算法理解图像配准中的LMeds、M-estimators与RANSAC算法图像特征点匹配之KD-Tree 摄像机成像的几何模型形态学运算：膨胀，腐蚀，开运算，闭运算... 神经网络的理解特征提取与特征选择几何矩的物理意义，由Camshift算法引起

CCPlus 8

C++并发编程实战-读书简记 Effective C++-读书简记编程珠玑-读书简记 Normalized Cut的C++源码 ICF，DPM等行人检测算法实践利用UDP协议进行图像传输 C++编程思想-读书简记 C++使用时的常见问题汇总

读书笔记 123

与塞涅卡共进早餐：斯多葛哲学的人生艺术-读书简记生活的艺术家-读书简记看见孩子-读书简记秒懂金融-读书简记与巴菲特共进午餐时，我顿悟到的5个真理：探寻财富、智慧与价值投资的转变之旅-读书简记孩子的品格：写给父母的积极心理学-读书简记家有琴童-读书简记超越百岁：长寿的科学与艺术-读书简记千脑智能-读书简记禅与摩托车维修艺术-读书简记笔记的方法-读书简记心经抉隐-读书简记刷新：重新发现商业与未来-读书简记认知觉醒-读书简记真希望我父母读过这本书-读书简记模仿欲望-读书简记蛤蟆先生去看心理医生-读书简记置身事内：中国政府与经济发展-读书简记跑步圣经（第2版）-读书简记宇宙-读书简记十分钟冥想-读书简记当我谈跑步时，我谈些什么-读书简记乔布斯、禅与投资-读书简记掌控习惯-读书简记 AI未来进行式（李开复陈楸帆新书）-读书简记金钱心理学-读书简记被讨厌的勇气-读书简记思考的框架-读书简记身心合一的奇迹力量-读书简记零极限-读书简记投资最重要的事-读书简记语言学的邀请-读书简记更富有、更睿智、更快乐-读书简记管理的常识-读书简记卡片笔记写作法-读书简记大脑通信员：认识你的神经递质-读书简记规模-读书简记纳瓦尔宝典-读书简记卓有成效的管理者-读书简记贪婪的多巴胺-读书简记清醒的活-读书简记像哲学家一样生活：斯多葛哲学的生活艺术-读书简记你是你吃出来的-读书简记你可以跑的更快-读书简记丹尼尔斯经典跑步训练法-读书简记非暴力沟通-读书简记异类-读书简记稀缺-读书简记为什么要睡觉-读书简记事实-读书简记世界上最快乐的人-读书简记病毒学概览-读书简记免疫学概览-读书简记内观-读书简记沟通的艺术-读书简记你的生命有什么可能-读书简记演化的故事-读书简记经济学原理：宏观经济学分册-读书简记经济学原理：微观经济学分册-读书简记社会心理学-读书简记追寻记忆的痕迹-读书简记情绪-读书简记远见：如何规划职业生涯3阶段-读书简记存在主义心理治疗-读书简记 P·E·T父母效能训练-读书简记彼得·林奇的成功投资-读书简记 2015-2020美国居民膳食指南-读书简记中国居民膳食指南（2016）-读书简记批判性思维-读书简记代码大全-读书简记游戏力-读书简记成功，动机与目标-读书简记基因组：人种自传23章-读书简记 YOU身体使用手册-读书简记登天之梯-读书简记为什么学生不喜欢上学-读书简记请停止无效努力-读书简记麦肯基疗法-读书简记跟简七学理财-课程简记指数基金投资指南（2017中信版）-读书简记指数基金投资指南（2015雪球版）-读书简记让大脑自由：释放天赋的12条定律-读书简记养育的选择-读书简记 GPU高性能编程CUDA实战-读书简记百万富翁快车道-读书简记原则-读书简记穷查理宝典-读书简记 C++并发编程实战-读书简记哲学家们都干了些什么-读书简记 Effective C++-读书简记通往财富自由之路-读书简记 Linux命令行与Shell脚本编程大全-读书简记刻意练习-读书简记写给大家看的设计书-读书简记习惯的力量-读书简记好好学习-读书简记硅谷最受欢迎的情商课-读书简记富爸爸，穷爸爸-读书简记如何说孩子才会听，怎么听孩子才会说-读书简记阻力最小之路-读书简记 ProGit-读书简记思考：快与慢-读书简记 C语言深度剖析-读书简记编程珠玑-读书简记 Head First 设计模式-读书简记反脆弱-读书简记小强升职记-读书简记观呼吸-读书简记黑客与画家-读书简记晨间日记的奇迹-读书简记如何高效学习-读书简记即兴的智慧-读书简记精力管理-读书简记 C++编程思想-读书简记拖延心理学-读书简记自控力-读书简记伟大是熬出来的-读书简记生命不能承受之轻-读书简记高效能人士的七个习惯-读书简记没有任何借口-读书简记一分钟的你自己-读书简记人生不设限-读书简记暗时间-读书简记

精力时间管理 8

小强升职记-读书简记观呼吸-读书简记晨间日记的奇迹-读书简记如何高效学习-读书简记精力管理-读书简记拖延心理学-读书简记高效能人士的七个习惯-读书简记暗时间-读书简记

记录 2

写在三十一岁-跳船简记活着，为了什么

Latex 1

使用Latex的一些经验技巧汇总

Opencv 3

Linux下Opencv的安装及配置使用 Opencv交叉编译及Arm平台移植 Opencv使用时的常见问题汇总

计算机视觉 25

RefineDet-论文简记学习DQN（Deep Q-Learning Network） DenseNet-论文简记 TensorFlow实现生成对抗网络GAN-翻译 Mask RCNN-论文简记 Feature Pyramid Networks for Object Detection-论文简记目标检测之YOLOv2 目标检测之YOLO，SSD 目标检测之RCNN，SPP-NET，Fast-RCNN，Faster-RCNN ResNet的理解及其Keras实现 GoogLeNet的理解及其Keras实现配置SSD进行目标检测 VGGNet的理解及其Keras实现 AlexNet的理解及其Keras实现理解SVM算法最小二乘法的参数估计视觉中的二维射影变换及多视角几何强化学习与马尔科夫决策过程理解EM算法理解图像配准中的LMeds、M-estimators与RANSAC算法图像特征点匹配之KD-Tree 摄像机成像的几何模型形态学运算：膨胀，腐蚀，开运算，闭运算... 特征提取与特征选择几何矩的物理意义，由Camshift算法引起

自我管理 6

习惯的力量-读书简记好好学习-读书简记硅谷最受欢迎的情商课-读书简记我的阅读书单自控力-读书简记伟大是熬出来的-读书简记

嵌入式 5

嵌入式ARM下常用环境的配置及常见问题汇总 Opencv交叉编译及Arm平台移植利用UDP协议进行图像传输移植Wifi模块RT3070到ARM平台 Linux下PC版及ARM版QT环境配置，ARM移植及触摸屏支持

Linux 13

Linux命令行与Shell脚本编程大全-读书简记 Ubuntu下搭建CUDA开发环境使用Wget下载整个网站嵌入式ARM下常用环境的配置及常见问题汇总 Ubuntu下常用软件的安装使用及常见问题汇总 Windows下Cygwin的使用 Upper-Body Detection源码配置及使用 Linux下Opencv的安装及配置使用 Linux下Matlab的安装及配置使用 ICF，DPM等行人检测算法实践利用UDP协议进行图像传输移植Wifi模块RT3070到ARM平台 Linux下PC版及ARM版QT环境配置，ARM移植及触摸屏支持

Arm 5

嵌入式ARM下常用环境的配置及常见问题汇总 Opencv交叉编译及Arm平台移植利用UDP协议进行图像传输移植Wifi模块RT3070到ARM平台 Linux下PC版及ARM版QT环境配置，ARM移植及触摸屏支持

安装配置 16

高效工作—优雅的阅读微信公众号配置SSD进行目标检测 Ubuntu下搭建CUDA开发环境装机相关问题汇总 Normalized Cut的C++源码 Windows下Cygwin的使用 Windows系统下的一些经验技巧车牌检测及识别 OpenALPR Upper-Body Detection源码配置及使用 Linux下Opencv的安装及配置使用 Linux下Matlab的安装及配置使用 Opencv交叉编译及Arm平台移植 ICF，DPM等行人检测算法实践使用Tesseract-OCR进行文字识别移植Wifi模块RT3070到ARM平台 Linux下PC版及ARM版QT环境配置，ARM移植及触摸屏支持

编程 27

健康工作—智能久坐提醒软件编程经典图书-排名榜 GPU高性能编程CUDA实战-读书简记 C++并发编程实战-读书简记 Effective C++-读书简记豆瓣离线备份-Shell脚本 Ubuntu下搭建CUDA开发环境高效工作—快捷键整理 C语言深度剖析-读书简记编程珠玑-读书简记 Head First 设计模式-读书简记链家爬虫 Python的文件操作与输入输出 Python的映射和集合类型 Python序列相关知识总结 Python实现CSDN博客的完整备份自己造的轮子们开源多线程编程中的几个概念按拍摄日期一键归类照片 Python Theano利用GPU进行深度学习加速的配置及使用 Linux下Opencv的安装及配置使用 Opencv交叉编译及Arm平台移植 Python使用过程中常见问题汇总 Git常用命令总结正则表达式及在Python中的使用利用UDP协议进行图像传输 C++编程思想-读书简记

开源 6

豆瓣离线备份-Shell脚本链家爬虫 Python实现CSDN博客的完整备份自己造的轮子们开源按拍摄日期一键归类照片 Python 利用UDP协议进行图像传输

Python 10

豆瓣离线备份-Shell脚本链家爬虫 Python的文件操作与输入输出 Python的映射和集合类型 Python序列相关知识总结 Python实现CSDN博客的完整备份按拍摄日期一键归类照片 Python Theano利用GPU进行深度学习加速的配置及使用 Python使用过程中常见问题汇总正则表达式及在Python中的使用

机器学习 21

RefineDet-论文简记机器学习经典图书-排名榜学习DQN（Deep Q-Learning Network） DenseNet-论文简记 TensorFlow实现生成对抗网络GAN-翻译 Mask RCNN-论文简记 Feature Pyramid Networks for Object Detection-论文简记目标检测之YOLOv2 目标检测之YOLO，SSD 目标检测之RCNN，SPP-NET，Fast-RCNN，Faster-RCNN ResNet的理解及其Keras实现 GoogLeNet的理解及其Keras实现配置SSD进行目标检测 VGGNet的理解及其Keras实现 AlexNet的理解及其Keras实现理解SVM算法强化学习与马尔科夫决策过程理解EM算法 Theano利用GPU进行深度学习加速的配置及使用神经网络的理解特征提取与特征选择

模式识别 19

RefineDet-论文简记 DenseNet-论文简记 TensorFlow实现生成对抗网络GAN-翻译 Mask RCNN-论文简记 Feature Pyramid Networks for Object Detection-论文简记目标检测之YOLOv2 目标检测之YOLO，SSD 目标检测之RCNN，SPP-NET，Fast-RCNN，Faster-RCNN ResNet的理解及其Keras实现 GoogLeNet的理解及其Keras实现 VGGNet的理解及其Keras实现 AlexNet的理解及其Keras实现理解SVM算法视觉中的二维射影变换及多视角几何强化学习与马尔科夫决策过程理解EM算法摄像机成像的几何模型神经网络的理解特征提取与特征选择

Git 2

ProGit-读书简记 Git常用命令总结

Matlab 1

Linux下Matlab的安装及配置使用

图像特征点匹配 3

最小二乘法的参数估计理解图像配准中的LMeds、M-estimators与RANSAC算法图像特征点匹配之KD-Tree

设计模式 1

Head First 设计模式-读书简记

分享 12

最重要的投资挖掘好书神器-书海星空挖掘好书神器-书海星空豆瓣图书TOP 999 豆瓣图书最受欢迎的TOP 999 挖掘好书神器-好书一下健康工作—智能久坐提醒软件机器学习经典图书-排名榜编程经典图书-排名榜高效工作—优雅的阅读微信公众号高效工作—快捷键整理知乎上赞同数最高的999个回答

技术 2

Linux命令行与Shell脚本编程大全-读书简记 ProGit-读书简记

育儿育己 7

P·E·T父母效能训练-读书简记游戏力-读书简记登天之梯-读书简记为什么学生不喜欢上学-读书简记让大脑自由：释放天赋的12条定律-读书简记养育的选择-读书简记如何说孩子才会听，怎么听孩子才会说-读书简记

Shell 1

Linux命令行与Shell脚本编程大全-读书简记

深度学习 2

学习DQN（Deep Q-Learning Network）配置SSD进行目标检测

目标检测 5

Mask RCNN-论文简记 Feature Pyramid Networks for Object Detection-论文简记目标检测之YOLOv2 目标检测之YOLO，SSD 目标检测之RCNN，SPP-NET，Fast-RCNN，Faster-RCNN

论文简记 2

Mask RCNN-论文简记 Feature Pyramid Networks for Object Detection-论文简记

翻译 1

TensorFlow实现生成对抗网络GAN-翻译

经管理财 3

跟简七学理财-课程简记指数基金投资指南（2017中信版）-读书简记指数基金投资指南（2015雪球版）-读书简记

书单 7

最重要的投资挖掘好书神器-书海星空豆瓣图书TOP 999 豆瓣图书最受欢迎的TOP 999 挖掘好书神器-好书一下机器学习经典图书-排名榜编程经典图书-排名榜

使用Tesseract-OCR进行文字识别

2014年08月06日

写在前面

近日做铸件文字识别的项目，需要识别铸件上的字符和数字，找到开源的识别库Tesseract，下面简单记录下怎么使用。

环境配置

首先在其项目主页下载库和相应的字库。由于本人使用的是VS2010，而其lib和include等库使用的VS2008进行编译的，所以自己又进行了VS2010版本的编译。用VS2010的同学可以在这里下载我编译好库直接使用。

然后进行配置，和其他库的配置类似，include lib dll。

使用实例

#include "allheaders.h"  
#include "baseapi.h"  
#include "strngs.h"  
#include <cv.h>  
#include <highgui.h>  
#include <iostream>  
using namespace cv;  
using namespace std;  

int _tmain(int argc, _TCHAR* argv[])  
{  
    char *image_path="zj.jpg";  
    tesseract::TessBaseAPI  api;  
    api.Init(NULL,"eng",tesseract::OEM_DEFAULT);  

    api.SetPageSegMode(tesseract::PSM_AUTO);  

    FILE* fin = fopen(image_path, "rb");  
    if (fin == NULL) {  
        printf("Cannot open input file: %s\n", image_path);  
        exit(2);  
    }  
    fclose(fin);  

    PIX   *pixs;  
    if ((pixs = pixRead(image_path)) == NULL) {  
        printf("Unsupported image type.\n");  
        exit(3);  
    }  
    pixDestroy(&pixs);  

    STRING text_out;  
    if (!api.ProcessPages(image_path, NULL, 0, &text_out)) {  
        printf("Error during processing.\n");  
    }  

    cout<<"识别结果为："<<text_out.string();  

    return 0;  
}

版权声明：本文为博主原创文章，转载请注明出处。本文总阅读量次