| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> Python知识库 -> python3安装OCR识别库tesserocr过程图解 -> 正文阅读 |
|
[Python知识库]python3安装OCR识别库tesserocr过程图解 |
参考链接: https://www.jb51.net/article/183990.htm 一、OCR简介OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程,对应图形验证码来说,它们都是一些不规则的字符,这些字符是由字符稍加扭曲变换得到的内容,我们可以使用OCR技术来讲其转化为电子文本,然后将结果提取交给服务器,便可以达到自动识别验证码的过程。 二、安装提示:可选择下载已打包的所需文件: https://wwa.lanzoui.com/iujjZsn6qwf ? 1.安装tesserocr1、打开链接,https://digi.bib.uni-mannheim.de/tesseract/,见下图。 下载最新版的tesseract-ocr-w64-setup-v5.0.0.20190623.exe,然后安装,本人直接安装在C盘目录下。安装完毕后,如下图。 2.配置环境变量,有两个步骤。 在系统变量里,修改path,如下图。 3.在系统变量里,创建一个新的变量名为:TESSDATA_PREFIX,值为:C:\Program Files\Tesseract-OCR\tessdata(根据自己安装的tesserocr安装路径为准),如下图。 注意:路径的写法 4.检查Tesseract-OCR是否安装完成,如下图。 2.安装 pytesseract1、安装Python的OCR识别库
2、python加载Window的tesserocr应用,要修改pytesseract三方库的pytesseract.py脚本。 打开pytesseract.py,将Window的tesserocr应用的tesserocr.exe绑定好。 三、测试到这里Python的绑定window的tesserocr应用已经完成。 读取验证码图片
?结果: ?四、读取中文文本图片1、因为OCR读取不同语言需要加载语言包,因此需要下载简体中文语言包。 2.现在,我们来读取如下图片的中文文本内容。 代码:
效果: ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/26 12:16:53- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |
数据统计 |