请停止无效努力-读书简记 麦肯基疗法-读书简记 跟简七学理财-课程简记 指数基金投资指南(2017中信版)-读书简记 指数基金投资指南(2015雪球版)-读书简记 让大脑自由:释放天赋的12条定律-读书简记 养育的选择-读书简记 GPU高性能编程CUDA实战-读书简记 百万富翁快车道-读书简记 原则-读书简记 穷查理宝典-读书简记 C++并发编程实战-读书简记 哲学家们都干了些什么-读书简记 Effective C++-读书简记 通往财富自由之路-读书简记 Linux命令行与Shell脚本编程大全-读书简记 刻意练习-读书简记 写给大家看的设计书-读书简记 习惯的力量-读书简记 好好学习-读书简记 硅谷最受欢迎的情商课-读书简记 富爸爸,穷爸爸-读书简记 如何说孩子才会听,怎么听孩子才会说-读书简记 阻力最小之路-读书简记 ProGit-读书简记 思考:快与慢-读书简记 C语言深度剖析-读书简记 编程珠玑-读书简记 Head First 设计模式-读书简记 反脆弱-读书简记 我的阅读书单 小强升职记-读书简记 观呼吸-读书简记 黑客与画家-读书简记 晨间日记的奇迹-读书简记 如何高效学习-读书简记 即兴的智慧-读书简记 精力管理-读书简记 C++编程思想-读书简记 拖延心理学-读书简记 自控力-读书简记 伟大是熬出来的-读书简记 生命不能承受之轻-读书简记 高效能人士的七个习惯-读书简记 没有任何借口-读书简记 一分钟的你自己-读书简记 人生不设限-读书简记 暗时间-读书简记

使用Tesseract-OCR进行文字识别

2014年08月06日

写在前面


近日做铸件文字识别的项目,需要识别铸件上的字符和数字,找到开源的识别库Tesseract,下面简单记录下怎么使用。

环境配置


首先在其项目主页下载库和相应的字库。由于本人使用的是VS2010,而其lib和include等库使用的VS2008进行编译的,所以自己又进行了VS2010版本的编译。用VS2010的同学可以在这里下载我编译好库直接使用。

然后进行配置,和其他库的配置类似,include lib dll。

使用实例


#include "allheaders.h"  
#include "baseapi.h"  
#include "strngs.h"  
#include <cv.h>  
#include <highgui.h>  
#include <iostream>  
using namespace cv;  
using namespace std;  

int _tmain(int argc, _TCHAR* argv[])  
{  
    char *image_path="zj.jpg";  
    tesseract::TessBaseAPI  api;  
    api.Init(NULL,"eng",tesseract::OEM_DEFAULT);  

    api.SetPageSegMode(tesseract::PSM_AUTO);  

    FILE* fin = fopen(image_path, "rb");  
    if (fin == NULL) {  
        printf("Cannot open input file: %s\n", image_path);  
        exit(2);  
    }  
    fclose(fin);  

    PIX   *pixs;  
    if ((pixs = pixRead(image_path)) == NULL) {  
        printf("Unsupported image type.\n");  
        exit(3);  
    }  
    pixDestroy(&pixs);  

    STRING text_out;  
    if (!api.ProcessPages(image_path, NULL, 0, &text_out)) {  
        printf("Error during processing.\n");  
    }  

    cout<<"识别结果为:"<<text_out.string();  

    return 0;  
} 

版权声明:本文为博主原创文章,转载请注明出处 本文总阅读量    次