| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> Python知识库 -> python进行批量图片文字识别 -> 正文阅读 |
|
[Python知识库]python进行批量图片文字识别 |
一、概述ocr技术是当下比较热门的技术,利用它可以方便的对图片上的文字进行扫描识别,本文使用python+百度api实现图片的文字识别。 二、环境准备:1. python环境的准备 1.1 首先需要到python官网下载最新版本的python,点击python下载。下载完成后进行安装,程序会自动进行环境变量配置。 安装配置完成后,运行python -v 若出现版本则表示安装成功。
1.2 安装百度api库。python安装完成后,运行以下命令安装百度api库
2. 百度云api的注册 接下来需要进行百度api的注册申请,点击百度ai进入官网 进入官网后,点击右上角控制台 进行账号登陆,登陆完成后出现控制台界面,点击左侧产品服务——人工智能——文字识别。 点击创建应用,并在相应页面填写好相关信息,然后点击立即创建。 创建完成后回到控制台点击管理应用。 刚刚创建好的文字识别应用就会出现在应用列表中,其中的APP_ID,API_KEY,SECRET_KEY需要记住,这三项是我们需要用到的。 三、实现:1. 首先要在当前文件夹下建立一个text目录,用于存放识别出的文本文件。对文件夹内的所有图片进行识别,需要用到os.walk(path)函数来遍历目录,并寻找所有后缀为jpg格式的图片。walk()方法语法格式为 os.walk(top, topdown = True, onerror = None, followlinks = False) 代码如下:
由于walk函数递归查找目录,我们只在当前目录下寻找图片,因此在第一次循环结束就直接break,当前目录下所有图片名保存在pic变量里 2. 使用百度api来进行图片识别
其中"aaa","bbb","ccc"是之前申请百度api中得到的APP_ID,API_KEY,SECRET_KEY三个对应值。识别结果保存在dic_result变量中。其中basicAccurate(image)为高精度识别函数,如果使用低精度识别,请使用accurate(image)函数 3. 项目代码如下:
四、运行效果程序扫描了目录下的2张照片,并将扫描内容存入text文件夹下的文本文档。识别过程如下: ?程序扫描出的文字 五、总结:1. python实现的是命令行界面的识别过程,比较简单,可以考虑做成图形界面。 2. 在写入中文文档时若报错,可将文件打开格式设置为”utf-8“
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/25 14:34:06- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |
数据统计 |