博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Centos 6 tesseract安装
阅读量:6259 次
发布时间:2019-06-22

本文共 1193 字,大约阅读时间需要 3 分钟。

最近在进行Python数据爬虫方向的研究,使用到了与图像识别相关的一些功能,这样就会使用到图像识别的重要工具Tesseract。下面就在CentOS环境下安装和配置Tesseract的工作环境进行讲解。查阅了网上很多资料,现将自己的安装和测试过程记录如下:

  1. 安装依赖库leptioncal库

 1.1 进入供存放下载文件库的目录:执行wget  ,出现如下图所示软件下载界面:

 

 后顺序执行下面四个指令: 

 1.2 执行解压指令  tar -xvf leptonica-1.72.tar.gz;

 1.3 进入leptonica-1.72目录,执行配置指令 ./configure

 1.4 执行编译指令 make

 1.5 执行安装指令 make install

 至此,leptonica安装完毕

  1. 安装Tesseract编译要用的automake和libtool

2.1 yum install automake

2.2 yum install libtool

  1. 安装tesseract

3.1 下载Tesseract 3.04版本

wget

3.2 下载完成后,修改下安装包的名字以作区分

mv 3.04.00.tar.gz  Tesseract3.04.tar.gz

3.3 参考上面的leptonica安装步骤,首先解压Tesseract3.04.tar.gz  tar -xvf Tesseract3.04.tar.gz

3.4 进入解压后的目录:tesseract-3.04.00  cd tesseract-3.04.00,进入目录后发现目录下有一个autogen.sh,执行之,结果如下图:

3.5 执行配置指令 ./configure

在执行过程中,出现错误:

表明缺少了缺少c++编译器,执行下面命令安装:

yum install gcc-c++

然后再次执行./configure命令,成功。

3.6 执行编译指令 make

3.7 执行安装指令 make install

4 下载安装英文,中文繁体,中文简体 识别库

wget --no-check-certificate
wget --no-check-certificate  
wget --no-check-certificate


作者:perfecttshoot

来源:CSDN
原文:
版权声明:本文为博主原创文章,转载请附上博文链接!

按照上文在Centos中安装tesseract中,至tesseract的make时又出现make error的问题,执行运行 autoreconf -ivf 解决。

关于最后的中英文识别库,安装好后将其复制一份到/usr/local/share/(此处不全,具体看报错信息)就OK啦

转载于:https://www.cnblogs.com/greystone/p/10781010.html

你可能感兴趣的文章
windows服务 MVC之@Html.Raw()用法 文件流的读写 简单工厂和工厂模式对比
查看>>
PHP解析URL并得到URL中的参数
查看>>
【vue.js】绑定click事件
查看>>
字体属性
查看>>
linux的iptables和firewall的区别
查看>>
Install RabbitMQ server in CentOS 7
查看>>
Eureka的优势
查看>>
Android项目实战(一): SpannableString与SpannableStringBuilder
查看>>
idea中的language level 介绍
查看>>
CTSC 2018酱油记
查看>>
php框架排名(Laravel一直第一)
查看>>
行贿罪、受贿罪刑事辩护6大要点
查看>>
java日期格式(年月日时分秒毫秒)
查看>>
看懂UML类图
查看>>
c#串口编程(转)
查看>>
OpenMVG学习笔记
查看>>
Ubuntu下 fatal error: Python.h: No such file or directory 解决方法
查看>>
微信小程序 (node) warning: possible EventEmitter memory leak detected
查看>>
写给大忙人的spring cloud 1.x学习指南
查看>>
mycat->oracle报java.sql.SQLException: 无法从套接字读取更多的数据
查看>>