IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 移动开发 -> PaddleOCR测试 -> 正文阅读

[移动开发]PaddleOCR测试

1. 环境搭建

1.1 项目地址

https://github.com/PaddlePaddle/PaddleOCR

1.2 Android Studio安装

  1. 从官网下载Android studio。
  2. 安装SDK。
    在这里插入图片描述

3.安装USB Driver。在这里插入图片描述

1.3 导入项目

  1. Android Studio点击import project。
    在这里插入图片描述

2.从项目文件种选择deploy/android_demo进行导入。
在这里插入图片描述
等待Android Studio安装相关包。

1.4 测试项目

  1. 用数据线连接手机,并进入开发者模式。
  2. 将项目运行在手机上。
    在这里插入图片描述

2 测试效果

在这里插入图片描述

3 纯英文模型效果

3.1 OCRV3拍照识别

将demo中的模型更换为英文模型。
在这里插入图片描述
更换英文字库后识别存在一定问题,暂时还没找到原因。

4 效果对比

分别使用以下九种模型对两张图片进行识别
一张是照片拍摄的现实照片,记作图片A
在这里插入图片描述
另一张是截图的网站图片,记作图片B
在这里插入图片描述

4.1 模型ch_PP-OCRv2

对图片A的识别结果
在这里插入图片描述
识别时间
828.0 ms
识别率普遍偏高, 仅有一行对于空格处理出现问题,对两个单词识别遗漏
对图片B的识别结果
在这里插入图片描述
不能识别且不能检测

4.2 模型ch_PP-OCRv2_old

该模型是项目中原本存在的模型, 不清楚转换之前的版本
对图片A的识别结果
在这里插入图片描述

识别时间
958.0 ms
单词遗漏验证,对空格识别效果差
对图片B的识别结果
在这里插入图片描述
不能识别且不能检测

4.3 模型ch_PP-OCRv2_slim

该模型是ch_PP-OCRv2模型的裁剪版
对图片A的识别结果
在这里插入图片描述
识别时间
891.0ms
相较ch_PP-OCRv2,该模型会把某些英文字符识别成中文
对图片B的识别结果
在这里插入图片描述
不能识别且不能检测

4.4 模型ch_PP-OCRv3

对图片 A 的识别效果
在这里插入图片描述识别时间
1178.0ms
能够识别出所有字符,但是对空格处理结果十分糟糕

对图片B的识别效果
在这里插入图片描述
不能识别且不能检测

4.5 模型ch_PP-OCRv3_slim

该模型是ch_PP-OCRv3的裁剪版

程序运行闪退

4.6 模型ch_ppocr_mobile_v2.0

对图片A的识别效果
在这里插入图片描述
识别时间
1048.0ms

除有一行出现分行检测外,识别和空格处理都表现优秀

对图片B的识别效果
在这里插入图片描述
不能识别且不能检测

4.7 模型ch_ppocr_mobile_slim_v2.0

对图片A的识别效果
在这里插入图片描述
识别效果混乱,不能检测到整行文本,检测结果为一行中多个不连续部分。
识别时间
951.0ms

对图片B的识别效果
在这里插入图片描述不能识别且不能检测

4.8 模型ch_ppocr_server_v2.0

这是适用于服务器的模型
对图片A的识别效果
在这里插入图片描述
识别时间
668.0ms

完美识别文本

对图片B的识别效果
在这里插入图片描述
不能识别且不能检测

4.9 模型en_PP-OCRv3

对图片A的识别结果
在这里插入图片描述
识别时间
1017.0ms

识别率低,而且不能输出正确的识别文本,目前还没有找到原因

对图片B的识别效果
在这里插入图片描述
不能识别且不能检测

5 总结

对于图片B都出现了不能识别的问题, 经过对图片放大处理得到了下面两种结果
一个是带有黑色背景的图片,另一个是去除掉黑色背景的图片。
在这里插入图片描述
在这里插入图片描述
完美识别图像
在这里插入图片描述
在这里插入图片描述
出现了同ch_ppocr_mobile_slim_v2.0模型一样的效果,不能识别整行文字.
抛开识别效果来看,模型不能检测和识别图像B的原因可能是因为安卓端代码的处理限制。这部分内容需要更加深入理解安卓demo的源码

综上所述, 八号模型ch_ppocr_server_v2.0是表现最优的,但是遇到复杂图像运行速度慢,且本身体积是其他模型的6–7倍. 在综合考虑下可以选择以六号模型ch_ppocr_mobile_v2.0为基础进行研究。

6 ML kit

原图
在这里插入图片描述
效果
在这里插入图片描述
ML kit是以扫描的形式进行文字提取。

  移动开发 最新文章
Vue3装载axios和element-ui
android adb cmd
【xcode】Xcode常用快捷键与技巧
Android开发中的线程池使用
Java 和 Android 的 Base64
Android 测试文字编码格式
微信小程序支付
安卓权限记录
知乎之自动养号
【Android Jetpack】DataStore
上一篇文章      下一篇文章      查看所有文章
加:2022-08-19 19:17:25  更:2022-08-19 19:19:00 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 4:35:32-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码