IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> python学习使用easyocr识别图片文字 -> 正文阅读

[Python知识库]python学习使用easyocr识别图片文字

??测试了C#中调用PaddleOCRSharp和PaddleSharp进行图片文字识别,由于正在学习python,也就同时学习使用python进行图片文字识别的方法。
??百度关键词“python ocr”,搜出来的参考文献1中推荐用easyocr模块,同时在GitHub中搜索python编写的ocr库,easyocr也排名靠前,于是决定使用easyocr测试识别图片文字。
在这里插入图片描述
??直接使用下列命令安装easyocr即可,虽然命令看着简单,但是下载速度不敢恭维,我后半夜电脑一直开着才下载安装成功的。

pip install easyocr

??easyocr安装完成后,根据参考文献2中的示例代码,只需几行代码即可完成图片文字识别,测试代码如下:

# coding=gbk
import easyocr

reader = easyocr.Reader(['ch_sim','en']) 
result = reader.readtext(r'd:\test\car2.jpg')
print(result)

??开始执行代码时,会看到如下提示,根据参考文献2中的说明,在windows平台中使用easyocr,可以在https://pytorch.org网站中安装torch和torchvision以支持GPU计算,这样能提高程序运行速度(本文只是初步测试,就没有安装)。

CUDA not available - defaulting to CPU. Note: This module is much faster with a GPU.

??继续运行程序,又遇到了模型下载的问题。easyocr默认是运行时在线下载检测模型,但是下载速度很慢,一直卡在2.9%。根据参考文献3-4,可以自己下载检测模型,并放到Users\HP.EasyOCR\model文件夹下,本文是从参考文献4中下载的英文和中文检测模型。
在这里插入图片描述在这里插入图片描述
??模型下载完毕后,再次运行程序即可正常运行。下图是原图及识别出的文字结果(还没有学会如何用python向图片中绘制图形,暂时只是打印识别结果)。可以看到,大部分文字是可以正确识别,但识别效果没有PaddleOCRSharp和PaddleSharp,估计主要是还没有熟悉easyocr的参数配置造成的。
在这里插入图片描述

[([[26, 22], [446, 22], [446, 98], [26, 98]], '(第代升级版 ]', 0.326044415449258), 
([[30, 90], [584, 90], [584, 146], [30, 146]], '工艺升缏更实惠安装后更显真实', 0.41460092922718944), 
([[149, 171], [735, 171], [735, 353], [149, 353]], '粤48202 |', 0.17590042433938227),
 ([[208, 362], [592, 362], [592, 436], [208, 436]], '', 0.0),
  ([[76, 466], [148, 466], [148, 586], [76, 586]], '粤', 0.5672634530003648), 
  ([[130, 432], [664, 432], [664, 645], [130, 645]], 'AE2021', 0.14427207043465085), 
  ([[595, 725], [781, 725], [781, 781], [595, 781]], '(全固封]', 0.4716126649097662)]

参考文献:
[1]https://zhuanlan.zhihu.com/p/342686109
[2]https://github.com/JaidedAI/EasyOCR
[3]https://blog.csdn.net/Loliykon/article/details/114334699
[4]https://blog.csdn.net/qq13933506749/article/details/122481211?spm=1001.2101.3001.6650.8&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7Edefault-8.pc_relevant_default&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7Edefault-8.pc_relevant_default&utm_relevant_index=11

测试图片来源
[1]https://baijiahao.baidu.com/s?id=1676249081188736513&wfr=spider&for=pc
[2]https://www.xjauto.net/html/cheping/202105/69508.html
[3]https://item.jd.com/10041422363991.html?openbpab=dontwritecookie&uabt=92_16_21&cu=true&utm_source=image.baidu.com&utm_medium=tuiguang&utm_campaign=t_1003608409_&utm_term=1a1dd3a2f0b24eaab2325b16b12d3d8d
[4]http://news.sohu.com/a/524033869_121124363

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-04-27 11:17:51  更:2022-04-27 11:18:57 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 15:48:41-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码