IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 基于卷积神经网络迁移学习的手写体汉字识别 -> 正文阅读

[人工智能]基于卷积神经网络迁移学习的手写体汉字识别

作者将基于经典的VGG-Net进行改进,构建出适合手写体汉字识别的浅层卷积神经网络模型,这个模型将适用于对3755个常用一级汉字的识别。在tensorflow环境下完成实验,得到的模型在验证集中的accuracy准确度可以达到97.44%,并且在作者书写及网上收集的手写汉字样本表现良好,并进一步对结果进行分析。
其次简要概述了深度学习的几种经典网络模型结构,并基于迁移学习的方法对它们进行实现。并进行与自己所改进的浅层CNN进行一个对比。
所使用的的配置如下

在这里插入图片描述

设备限制加上时间紧迫做的内容也不是很多与复杂,但也能顺利识别所写的图片。

将分成俩个实验:1.浅层CNN 2.迁移学习策略
所使用的数据集是由中科院自动化模式识别国家实验室在2010年05月所发布,其中分别有在线数据集与离线数据集。作者所使用的是CASIA-HWDB1.1数据集,包含了240张训练图片、60张测试图片,共有1,176,000 张手写图片。

1.浅层CNN及调参思路。

(ps:作者之前毕业时间紧迫只对learning rate 进行一个调整而已哈哈哈哈。)

本次实验是采用的是设计的网络结构,所改进模型训练而来,总汉字类别3755个,总共训练图片张数为1,176,000,其中验证集图片张数为223,987,初始化learning rate设置为0.1。
通过15000次的训练发现模型损失值一直居于0.9上下,无法再降低损失值。由于损失无法再下降,尝试通过改变learning rate,把learning rate的值设置为0.1,0.01,0.001,0.0001进行一个对比实验,得到的结果如图所示,当学习率为0.01,0.001,0.0001时损失值已经发生重叠,可以看到损失值已经得到提升,且准确率也得到了提升,综合损失值与准确率,最终确定学习率的最优参数为0.0001。
在这里插入图片描述
因此,learning rate选择0.01,由于batch size的大小为64,所以进行15000次训练,其实总样本只进行了约1轮次的训练,最后,对总样本进行15次训练,也就是对batch size为64张图片进行210000次训练。最终,在验证集accuracy准确度可以达到了97.44%,已经高于人类肉眼可识别的96.13%,已经达到理想水平。

2.迁移学习策略及调参思路

使用的数据集同上面实验,都将它们都进行15轮训练,结果如下图5-2所示,可以明显发现,ResNet在训练集中的表现最好,可以达到96.04%。但是它们在验证集上的表现却效果不佳,VGG16、VGG19、InceptionV3、ResNet50的验证集表现为58.30%、54.16%、45.53%、70.09%。
在这里插入图片描述

可以发现表现,训练集表现很好,在验证集表现很差,存在着过拟合,还需要进一步调参。最后对特征图与drop out rate 进行调整,最后的结果,由于之前毕设时间比较赶,所以就只有做到这个程度了。
在这里插入图片描述
最后给大家演示一下浅层CNN模型实际识别效果呀!!!!
自己写的几张照片哈哈哈
在这里插入图片描述
在这里插入图片描述

从baidu上找到几张图片
在这里插入图片描述
最后从测试集找几张图片看看哪些图片识别不出来,可以从下面俩张发现用人眼也很难识别出来哈哈哈哈。
在这里插入图片描述
在这里插入图片描述
由于这段比较闲就写了这个,之前做的毕业设计,确实也挺辛苦的,不容易。顺利毕业了反正哈哈哈,有问题和需要的同学可以问我,后续我也会对代码进行一个整理与上传到Github。
最后,声明一下,由于毕业好几个月了,电脑也进行了重装,有需要代码的,作者将在后续将代码上传到GitHub,耐心等待。后续也会将链接附在这

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-09-07 10:48:58  更:2021-09-07 10:49:22 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 15:53:43-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码