| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> PaddleOCR文字识别实践(一) -> 正文阅读 |
|
[人工智能]PaddleOCR文字识别实践(一) |
1、PaddleOCR介绍百度深度学习框架PaddlePaddle开源的OCR项目PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。PaddleOCR包含丰富的文本检测、文本识别以及端到端算法。 PaddleOCR特性:
PaddleOCR项目地址:https://github.com/PaddlePaddle/PaddleOCRGitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)https://github.com/PaddlePaddle/PaddleOCR 2、PaddleOCR项目实践过程2.1 运行环境本次实践所用的测试环境为: os:Win10; Python:3.6.8; 2.2 运行依赖库安装2.2.1 安装PaddlePaddle? ? ? PaddleOCR需在PaddlePaddle下才可以正常运行,开始之前请确保PaddlePaddle已经安装,具体安装过程如下: ? ? ? ?如果机器上安装的是CUDA9或CUDA10,请运行以下命令安装GPU版:
如果机器是CPU,请运行以下命令安装CPU版:
本文采用的是CPU2.0版,可用以下命令直接安装:
? ? ? ?(若要在GPU模式下使用除了有GPU外还需要安装CUDA 10.1和CUDNN对应文件,可自行上网百度。) 2.2.2?PaddleOCR安装? ? ? ?关于PaddleOCR的安装,可以直接在github上以压缩包的形式下载,如下图,然后解压到某一位置即可。项目地址:GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)https://github.com/PaddlePaddle/PaddleOCR? ? ? ? ? 亦可以用git clone命令把项目仓库直接下载到本地:
? ? ? ? 本文中是直接下载的压缩包。 ? ? ? ? ?本文中选择的是PaddleOCR2.4,解压后的文件如下图所示: 2.2.3 第三方依赖库? ? ? ? PaddleOCR的运行还需要一些第三方依赖库,在requirement.txt文件中,如下图所示,可执行以下命令进行安装:
? ? ?(个别的第三方库可能会下载失败或报错,可进行单独安装。) 2.2.4 模型下载? ? ? ?PaddleOCR提供的可下载模型包括推理模型、训练模型、预训练模型、slim模型,模型区别说明如下: ? ? ? ?本项目中下载的均为推理模型,下载的是中英文通用PP-OCR server模型(143.4M),如图所示。 ? ? ? ? 下载到本地之后分别进行解压,创建一个models文件夹,把下载好的模型文件解压到该models文件夹中,并将models文件夹放入到PaddleOCR根目录下。最终目录结构如下所示: ?2.2.5 文字识别测试?测试程序如下所示:
? ? ?测试结果如下: ?参考文献: |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 11:44:23- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |