[人工智能] 论文详读《基于改进 LeNet-5 模型的手写体中文识别》

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 论文详读《基于改进 LeNet-5 模型的手写体中文识别》 -> 正文阅读

[人工智能]论文详读《基于改进 LeNet-5 模型的手写体中文识别》

文章目录

基本信息

期刊：天津大学学报(自然科学与工程技术版)
IF = 1.152
出版时间：2020年8月

摘要

（1）中文手写体识别困境
中文字符数目繁多、相似性强、字体种类繁多、书写随意、缺乏统一规范等原因，一直是计算机视觉领域中一个具有挑战性的问题。
（2）本文方法
改进经典LeNet-5模型，提出LeNet-Ⅱ模型。
Step1： 利用改进的Inception模块和空洞卷积，设计了一种并行的双路卷积神经网络结构；双路的作用：两路分支可分别提取手写中文图像中不同尺度的特征，获得多个尺度的特征图像。

Step2： 通过对其进行特征融合，可以达到丰富特征图像多样性、提高识别准确率的目的。

Step3： 最后经过全连接层进行分类。

（2）结果
在中文数据集CASIA-HWDB1.1上准确率达到95.21%，高与经典LeNet-5和其他传统算法。
同时，在4幅找人手写的中文文本中的平均识别率也达到了97.30%。

0. 引言

手写中文识别分为：联机手写中文识别 和 脱机手写中文识别。与前者相比，后者没有可利用的笔画时序信息，识别难度更大，准确率更低。本文研究的后者。

1. 经典LeNet-5模型

LeNet-5 模型是一种常用的卷积神经网络，被广泛用于手写体数字识别领域。其模型结构：
在这里插入图片描述

1.1 对LeNet-5模型的分析

传统LeNet-5模型适用于手写体数字识别，但对手写中文数字识别的准确率较低。
原因如下：
（1）常用中文字符高达3755个，分类种类过多；
（2）手写中文比数字复杂，特征更多；
（3）LeNet-5 模型输入默认为32*32，不满足要求；
（4）LeNet-5 模型仅有 3 层卷积层，卷积层和池化层采用的卷积核个数都较少，是一个简单的串行网络，不足以提取足够多的特征；