IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 字母加数字 验证码识别 -----python(tesseract) -> 正文阅读

[Python知识库]字母加数字 验证码识别 -----python(tesseract)

一、准备工作

所需清单

  • 验证码图片一张
  • 安装Tesseract
  • pytesseract、PILLOW库的安装
  • python程序代码

二、验证码图片

  1. 从网上直接保存到本地。
  2. 通过图片url用python下载到本地。代码如下:
import requests

def download_img(img_url):
    r = requests.get(img_url,stream=True)
    print(r.status_code) # 返回状态码
    if r.status_code == 200:
        open(r'C:\Users\123\Desktop\demo.png', 'wb').write(r.content) # 将内容写入图片
        print("done")
    del r

if __name__ == '__main__':
    # 下载要的图片
    img_url = "https://mailsso.mxhichina.com/localproxy/imgcheckcode/get_img?type=150_40&identity=mailsso.mxhichina.com&sessionid=new-3e9947dd-231e-49ec-acf9-5e97be2cb04a"
    download_img(img_url)

结果如下,会在桌面生成一张png图片。在这里插入图片描述

三、Tesseract安装配置

1. tesseract下载

  • 如下图,安装不要勾选最后两个。若勾选,可能发生报错。
    在这里插入图片描述
    在这里插入图片描述

2. Tesseract 系统环境变量配置

  1. 按键盘Win键,搜索编辑系统环境变量,打开如下图:
    在这里插入图片描述

  2. 点击环境变量,如下图:
    在这里插入图片描述

  3. 选中Path,再点击编辑
    在这里插入图片描述

  4. 点击新建,再浏览tesseract安装路径,如图。最后点击确定

  5. 回到下图,在下图中,点击新建,
    在这里插入图片描述

  6. 变量名:TESSDATA_PREFIX ;变量值:C:\Program Files (x86)\Tesseract-OCR\tessdata,也就是你tesseract安装路径下的tessdata路径。在这里插入图片描述

  7. 至此我们已经配置完成了,随后就是需要去添加一些语言库。下载如下:

    链接:https://pan.baidu.com/s/19gsqKxIP9AaADWppCsapDA 
    提取码:6c2y 
    
  8. 将下载后的文件解压后的放到C:\Program Files (x86)\Tesseract-OCR\tessdata路径下,如下
    在这里插入图片描述

四、python库下载

  • 下载下面两个库
    pip install pytesseract
    pip install PILLOW
    
  • 打开下载完成的pytesseract.py 文件。将文件中对应行改为自己安装tesseract的路径tesseract.exe,如下
    tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
    
  • 将文件保存
  • 若不修改直接运行下面的程序会报错。

四、python代码

  • python代码

    import pytesseract
    from PIL import Image
    image = Image.open(r'C:\Users\123\Desktop\demo.png')
    code = pytesseract.image_to_string(image)
    print(code)
    
  • 代码结果:

    5m82
    

五、结语

验证码的识别到此结束,基于此可以去模拟登陆一些简单的网站(字母加数字的验证码网站)。
  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-08-08 11:17:17  更:2021-08-08 11:17:50 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/17 12:12:16-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码