IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> python+Ocr.dll 突破搜狗站长网址推送验证码 -> 正文阅读

[Python知识库]python+Ocr.dll 突破搜狗站长网址推送验证码

今天我在做SEO收录提升工具集的搜狗推送功能的时候,发现搜狗根本没有推送URL的接口,不过好在有一个地方可以推送URL,如下图:

图片

但是一次只能提交20个URL并且还需要验证码,这就有点困难了,本来打算用请求验证码识别平台返回验证码结果,但考虑到如果每天都要使用的话验证码识别费用也是一笔不小的开销,所以破解掉搜狗验证码势在必行

先把验证码下载下来

图片

没想到验证码竟然不是一张图片,而是一个SVG

图片

这里解释一下SVG,简单来说就是用代码绘制成的图片,无法直接下载保存为图片

我们这里就需要用python 把SVG转成jpg格式的图片保存下来

这里我们用到的库为svglib


from reportlab.graphics import renderPM
from svglib.svglib import svg2rlg

for i in range(100):
    res = requests.get('http://zhanzhang.sogou.com/api/user/generateVerifCode')

    f = io.StringIO(res.text)
    drawing = svg2rlg(f)
    renderPM.drawToFile(drawing, f"img/{i}.png", fmt="JPG")

图片

转换下载完成

调用ocr.dll进行验证码识别

ocr.dll据说是一个易语言编写的动态链接库,训练了大量图形验证码,识别成功率非常高

但是仅运行在32位Python中,因为ocr.dll它们是使用语言训练而成的,而易语言是32位的..

那么动态链接库,python中如何调用呢

  1. 导入ctypes 库

  2. 选择要调用的动态链接库,ctypes.windll.LoadLibrary可以调用动态链接库

  3. 初始化方法

  4. 请求验证码转成PNG格式的字节流并临时存储在内存中

  5. 调用ocr.dll动态链接库中的ocr方法

  6. 传入 PNG格式的字节流和字节流长度?这两个参数

  7. 返回结果

下面是代码demo


import ctypes
import os
import requests
import io
from reportlab.graphics import renderPM
from svglib.svglib import svg2rlg
os.environ['GLOG_minloglevel'] = '4'
ocr = ctypes.windll.LoadLibrary('../utils/ocr.dll')
ocr.init()
crack_func = ocr.ocr


res = requests.get('http://zhanzhang.sogou.com/api/user/generateVerifCode')
f = io.StringIO(res.text)
drawing = svg2rlg(f)
img = renderPM.drawToString(drawing,fmt="PNG")
img_len = len(img)
ret = str(ctypes.string_at(crack_func(img, img_len)), encoding='utf-8')
print(ret)

图片

测试识别结果

图片

对比一下原图,可以看到验证码识别率是非常高的,最重要的是不需要花一分钱去打码

不光是搜狗站长的验证码,市面上常见的数字字母组合验证码都可以轻松破解

?好了,有需要源代码的关注公众号SEO冰淇淋,添加我的个人微信索取吧!

图片

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-01-04 13:23:24  更:2022-01-04 13:25:57 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/16 3:17:09-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码