IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> PaddleOCR的整体理解 -> 正文阅读

[人工智能]PaddleOCR的整体理解

2021SC@SDUSC
??OCR全称为Optical Character Recognition,即光学字符识别技术。PP-OCR是在飞浆Paddle平台上发布的一种实用的超轻量级OCR系统,该系统由文本检测、检测框校正和文本识别三部分组成。我负责文本检测的方向分类器部分的深入学习和探索。
??PP-OCR系统选择CPU来提高计算效率,以满足处理大量图像的需求。具体工作流程为,图像先经过文字检测,将图中可能包含文字的部分进行分割处理,形成一个一个的检测框。然后系统矫正检测框,将检测框转换为水平矩形框进行后续的文本识别。在这个环节中矫正后的框体可能会被反转,系统使用方向分类器来检测并改正文本的方向为正向。最后系统进行文字识别,将检测框里的文字打印出来。过程如下图1。可微分二值化(DB,Differentiable Binarization)作为基于简单分割网络的文本检测器,CRNN作为文本识别器。
图1 PP-OCR的框架

??在文本检测方面,PP-OCR使用MobileNetV3作为文本检测器模型的骨架。当预测时间相同时,MobileNetV3可以达到更高的精度。方向分类器的主干也是MobileNetV3。由于方向分类这个任务比较简单,所以系统选用MobileNetV3_small_x0.35来平衡准确性和效率。基础数据增强算法(BDA,Base Data Augmentation)和RandAugment算法是很好的图像数据增强算法,而且可以用于方向分类器的训练。PP-OCR中就在方向分类的训练图像中使用了这两种算法。图像的分辨率与识别精度有关,PP-OCR将归一化图像的高度和宽度分别设置为48和192,以此来提高方向分类器的准确率。量化(quantization)可以减小模型体积和加速计算,但是会造成一定程度上的精度受损。由于骨架MobileNetV3中的激活函数为ReLU和hard swish,所以如果使用普通的PACT(PArameterized Clipping acTivation)量化会导致更高的量化损失。PACT对激活进行预处理的公式如下图2所示。系统采用改进后的PACT量化方法对方向分类器模型进行量化。改进后的PACT处理公式如下图3所示。
图2 PACT对激活进行预处理的公式
图3 改进后的PACT处理公式
??我将在以后的时间对方向处理器涉及的模型和算法进行深入学习和探究。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-11 17:31:30  更:2021-10-11 17:33:03 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 10:24:22-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码