IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 人脸表情识别PaddlePaddle学习1 -> 正文阅读

[人工智能]人脸表情识别PaddlePaddle学习1

目录

人脸检测

人脸表情识别初尝试

创建项目,挂载数据集

?环境导入

os模块

numpy模块

pandas模块

matplotlib.pyplot

matplotlib.image

cv2

加载数据集

数据标注

数据集定义

?模型选择和开发

?模型训练和优化

总结

参考项目


人脸检测

是一个回归任务。

图像分类与人脸检测,一个是分类任务, 一个是回归任务,两者在卷积层都可选择ResNet网络,只不过在输出时,分类任务将输出转化为概率,而回归任务在卷积层后做线性变化,激活后再线性变化将输出转化为坐标,用来描述人脸关键点信息。

两者另一直观的区别是损失函数的不同,图像分类使用CrossEntropyLoss即交叉熵Loss,而人脸检测计算距离,使用L1Loss,L2Loss,SmoothL1Loss,分别是绝对误差,均方误差与一个分段检测。

人脸表情识别初尝试

创建项目,挂载数据集

上传文件为压缩zip格式,与课程中显示页面相同,应该没有问题。

?环境导入

#环境导入
import os #对目录和文件进行读取及其他操作
import numpy as np  #矩阵计算的函数库
import pandas as pd #数据分析包
import matplotlib.pyplot as plt #绘图模块
import matplotlib.image as mpimg #图像基本操作模块,转换,通道等
import cv2 #图像处理库
import paddle
import warnings 
warnings.filterwarnings('ignore') # 忽略 warning

os模块

os.getcwd()函数,获取当前目录,工作目

?os.name?函数,获取当前使用的操作系统,其中?'nt'?是?windows,'posix'?是?linux?或者?unix

os.remove()函数,删除指定文件, os.remove('file.txt')

os.removedirs()函数,删除指定目录,os.removedirs('file')

os.system()函数,运行shell命令,不懂。

os.mkdir()函数,创建一个新目录

os.chdir()函数,改变当前路径到指定路径,os.chdir('/home')

os.listdir()函数,返回指定目录下的所有目录和文件

参考详见https://blog.csdn.net/u013455430/article/details/79898600

numpy模块

NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

pandas模块

python的一个数据分析包,提供了大量能使我们快速便捷地处理数据的函数和方法。

matplotlib.pyplot

绘图与显示图像模块。

参考详见https://blog.csdn.net/qq_31192383/article/details/53977822

matplotlib.image

也是对图像的一些操作,比如颜色转换。

cv2

计算机视觉,图像处理库。

加载数据集

!unzip -q -o data/data99885/F_E_R.zip

数据标注

在paddle课程中十二生肖例子中的Config文件的基础上进行数据标注,生成数据集标注文件train和test。

?

?

虽然中途因为搞不清路径与函数名之间的关系有error,但最后误打误撞成功生成了数据集标注文件train.txt和test.txt。?

数据集定义

接下来我们使用标注好的文件进行数据集类的定义,方便后续模型训练使用。

将定义数据集写入单独的python文件,还是会因为路径原因找不到数据集。

考虑直接将代码放入主代码,此时可以运行了。

?模型选择和开发

network = paddle.vision.models.resnet50(num_classes=get('num_classes'), pretrained=True)#使用paddle高层API
model = paddle.Model(network)
model.summary((-1, ) + tuple(get('image_shape')))#模型可视化

模型可视化结果

?

?

?模型训练和优化

EPOCHS = get('epochs')
BATCH_SIZE = get('batch_size')
#优化函数
def create_optim(parameters):
    step_each_epoch = get('total_images') // get('batch_size')
    lr = paddle.optimizer.lr.CosineAnnealingDecay(learning_rate=get('LEARNING_RATE.params.lr'),
                                                  T_max=step_each_epoch * EPOCHS)

    return paddle.optimizer.Momentum(learning_rate=lr,
                                     parameters=parameters,
                                     weight_decay=paddle.regularizer.L2Decay(get('OPTIMIZER.regularizer.factor'))) #正则化来提升精度


# 模型训练配置
model.prepare(create_optim(network.parameters()),  # 优化器
              paddle.nn.CrossEntropyLoss(),        # 损失函数
              paddle.metric.Accuracy(topk=(1, 5))) # 评估指标

# 训练可视化VisualDL工具的回调函数
visualdl = paddle.callbacks.VisualDL(log_dir='visualdl_log')

# 启动模型全流程训练
model.fit(train_dataset,            # 训练数据集
          valid_dataset,            # 评估数据集
          epochs=EPOCHS,            # 总的训练轮次
          batch_size=BATCH_SIZE,    # 批次计算的样本量大小
          shuffle=True,             # 是否打乱样本集
          verbose=1,                # 日志展示格式
          save_dir='./chk_points/', # 分阶段的训练模型存储路径
          callbacks=[visualdl])     # 回调函数使用

?

它卡住了,无法进展,要去问问老师吧。?

总结

至此,人脸表情识别的结构差不多了,虽然代码都是直接拿来用的,但是接下来还是要多理解下他的数据集和优化函数到底是怎么定义的。?

今天遇到的问题都是路径问题,归根究底是对代码的不理解导致的。

明天继续找出运行不成功的解决办法,让机器实现学习,再进行预测。

周五开始就要和老师和队友讨论下这个结构哪些是多余的,怎么精简,并做到更合适我们的项目。

参考项目

https://aistudio.baidu.com/aistudio/projectdetail/2182529

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-07-15 16:10:46  更:2021-07-15 16:10:50 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/17 21:40:12-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码