[人工智能] NLP学习D3-TF2chap3-4总结和代码实现(八股框架+CNN网络合集)+多线程

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> NLP学习D3-TF2chap3-4总结和代码实现(八股框架+CNN网络合集)+多线程 -> 正文阅读

[人工智能]NLP学习D3-TF2chap3-4总结和代码实现(八股框架+CNN网络合集)+多线程

今天早上3点就醒了，在床上读了一会原著，忍不住又看了一遍chap6的视频，后来到自习室继续看，对RNN\LSTM\GRU有了更深入的理解。吃完饭以后想着把BP再看下，毕竟这很基础。今天有时间再去回看下梯度下降。这些概念以前都看过，也挣扎过，所以知道大家学习时的痛苦。总觉得网上很少有教程能给出overview && vivid的解释，so i am trying to figure it out!
说来有趣，现在再来看这些概念，感觉比以前多理解了不少，有意思！！！
最近也进入了疯狂吸收cs知识的时候，求知欲爆棚！！！都没什么时间学英语了，不过要抓紧机会早成正反馈局面！！！

好了，现在08：16-------开始敲chap3的八股代码了！！！

------------------------------续D2

chap3实践

（一)问题
1、compile中的meric是仅仅打印出来，还是会根据这个选w参数？？？
就仅仅打印出来，供人参考，不参与优化；优化还是根据loss
参考文献：
https://blog.csdn.net/chenhepg/article/details/115721826
这篇里面还写了常用的参数；当然官网也有
在这里插入图片描述
2.model.fit的validation_freq参数
这个是说，过多少个epoch，用testdata验证一下。

3.super().init()用法
“我理解是，当需要继承父类构造函数中的内容，且子类需要在父类的基础上补充时，使用super().init()方法。
”
我的理解就是，先继承别人的，然后再进行补充，就要用这个super()
参考链接：
https://www.cnblogs.com/hancece/p/11177852.html

4.Model类中call函数的参数
原来第二个参数是input呀，怪不得。

在这里插入图片描述

（二）自己完成fashion数据集的任务
1、先看看数据集的样子
在这里插入图片描述

好开心呀，第一次自己独立写模型，虽然很简单，但是还是很开心！！！
代码如下：

import tensorflow as tf
from tensorflow.keras import Model
from tensorflow.keras.layers import Flatten,Dense
import matplotlib.pyplot as plt
fashion = tf.keras.datasets.fashion_mnist
(x_train, y_train), (x_test, y_test) = fashion.load_data()
x_train,x_test = x_train/255.0,x_test/255.0

class FashionModel(Model):
def init(self):
super(FashionModel, self).init()
self.f1 = Flatten()
self.d1 = Dense(128, activation=‘relu’)
self.d2 = Dense(10, activation=‘softmax’)
def call(self, x):
x = self.f1(x)
x = self.d1(x)
y = self.d2(x)
return y
model = FashionModel()

model.compile(optimizer=‘adam’,
loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
metrics=[‘sparse_categorical_accuracy’])

model.fit(x_train,y_train,batch_size=32,epochs=5,validation_data=(x_test,y_test),validation_freq=1)
model.summary()

训练效果：
在这里插入图片描述
后期会学画acc图的！！！！！

chap4很重要的其他附加功能

在这里插入图片描述
1、自制数据集，解决本领域应用（解决如何将本领域数据规则化导入）
（1）img.convert(‘L’)
PIL有九种不同模式: 1，L，P，RGB，RGBA，CMYK，YCbCr，I，F。
相当于转换为灰度图像，每个像素点用8个bit表示，表示0-255的灰度。
如果参数是1，也是用8位表示，不过是非黑即白，见参考链接。
img.convert(‘1’)
参考链接：https://www.cnblogs.com/haifwu/p/12825741.html
在这里插入图片描述
（2）reshape中-1的含义

https://blog.csdn.net/weixin_39449570/article/details/78619196

这么操作估计是因为np.save只能存1维和2维。所以需要转换吧。这样上面reshape的问题也解决了
在这里插入图片描述 https://blog.csdn.net/u010089444/article/details/52738479

(3)这里整体思路很有意思，值得学习
A、如果之前没保存数据，就生成数据并保存；如果保存了，就直接加载进来【毕竟生成一次还挺麻烦的】
B、生成train和test的思路相同，所以写个函数来实现：
读取txt的每一行，【0】为图片名称，求图片路径，加载图片，并进行处理；【1】为标签；分别一一对应保存进入x和y_。最后把列表变为np类型返回 x = np.array(x)# turn into numpy
不过不知道为什么要把y_变成64位整型？？/
C、PIL的Image可以用来加载、处理图片
在这里插入图片描述

具体代码：

import numpy as np
import tensorflow as tf
from PIL import Image
import os
# mnist = tf.keras.datasets.mnist
# (x_train, y_train), (x_test, y_test) = mnist.load_data()
# x_train, x_test = x_train / 255.0, x_test / 255.0
# 自己写入数据集
train_path = './mnist_image_label/mnist_train_jpg_60000/'
train_txt = './mnist_image_label/mnist_train_jpg_60000.txt'
x_train_savepath = './mnist_image_label/mnist_x_train.npy'
y_train_savepath = './mnist_image_label/mnist_y_train.npy'

test_path = './mnist_image_label/mnist_test_jpg_10000/'
test_txt = './mnist_image_label/mnist_test_jpg_10000.txt'
x_test_savepath = './mnist_image_label/mnist_x_test.npy'
y_test_savepath = './mnist_image_label/mnist_y_test.npy'
# 图片路径,标签文件
def generateds(path, txt):
    f = open(txt, 'r')
    contents = f.readlines()
    f.close()
    x,y_ =[],[]
    for content in contents:
        value = content.split()
        img_path = path+value[0]
        img = Image.open(img_path)
        # 图片变为8位宽灰度值的np.array格式
        img = np.array(img.convert('L'))
        img/=255.
        x.append(img)
        y_.append(value[1])
        print('loading:'+content)
    x = np.array(x)# turn into numpy
    y_ = np.array(y_)
    y_ = y_.astype(np.int64)#变为64位整型
    return x,y_

if os.path.exists(x_train_savepath) and os.path.exists(y_train_savepath)\
    and os.path.exists(x_test_savepath) and os.path.exists(y_test_savepath):
    print('----------------Load Datasets--------------')
    x_train_save = np.load(x_train_savepath)
    y_train = np.load(y_train_savepath)
    x_test_save = np.load(x_test_savepath)
    y_test = np.load(y_test_savepath)
    # 在np.save的时候只能存1维或2维,所以需要转换.本身是28*28的数据,恢复回来~
    x_train = np.reshape(x_train_save, (len(x_train_save),28,28))
    x_test = np.reshape(x_test_save, (len(x_test_save),28,28))
else:
    print('-------------Generate Datasets-----------------')
    x_train, y_train = generateds(train_path, train_txt)
    x_test, y_test = generateds(test_path, test_txt)
    print('-------------Save Datasets-----------------')
    x_train_save = np.reshape(x_train,(len(x_train),-1))
    x_test_save = np.reshape(x_test,(len(x_test),-1))
    np.save(x_train_savepath, x_train_save)
    np.save(y_train_savepath, y_train)
    np.save(x_test_savepath, x_test_save)
    np.save(y_test_savepath, y_test)

2、数据增强，扩充数据集（这里以image为例，有接口，注意它在六步八股文中的位置——在第二步，数据处理的部分）

（1）在做数据增强后，model.fit中的内容也要改变。
在这里插入图片描述
（2）数据增强本身

不知道为啥要给数据增加一个维度？？？

3、断点续训，存取模型（这个很重要啊！！！注意位置，在fit训练部分）
(1)取模型就用model.load_weights(path)
在这里插入图片描述
(2)存模型有两步
A定义回调函数

B在model.fit中设置，并取得返回值history
在这里插入图片描述

4、参数提取，存入文本（上面已经可以存模型，存参数了，但是参数具体时多少呢？也挺重要的）
（1）用model.trainable_variables返回参数
（2）设置np.set_printoptions(threshold=np.inf)保证能够被全部打印出来，不被省略

5、acc/losss可视化，查看训练效果（不会有人不会可视化叭？？？？）
咱就是说，没瞎想到刚才因为保存模型参数用到的回调函数的返回值history，居然这么nb。可以调出来这么多东西——相当于整个在训练过程中的这写我写的metrics里的评价指标和loss都有了。好家伙，直接plt就可以了。
在这里插入图片描述
好家了个活，连plt画子图都出来了。
好家伙在，我这个结果也是吓死我了

6、应用程序，给图识别（讲的其实是如何在别人的work上迁移模型直接进行预测，真好真贴心）
（1）复现模型（好进行前向传播）
（2）加载参数
（3）预测
在这里插入图片描述

嗯，我就自创一个把，根据之前保存的模型，对当前路径的几张图片进行预测

（1）img.resize参数
在这里插入图片描述

这个resize是改变图片大小，后面的参数是选择图片质量
参考：https://blog.csdn.net/xjp_xujiping/article/details/81607964
在这里插入图片描述

需要注意的是
（1）定义模型路径
（2）复现模型
（3）加载模型
（4）加载待预测数据并进行预处理，使其更符合训练时的情景。
（5）预测

带预测数据咋这样？？？tf.newaxis,…
这个就是相当于待预测数据不是没有batch那一维度嘛，生生加一个维度。

结果如上，可见tf.newaxis的主要用途是增加一个维度，位置不同，增加的维度是第几维也相对不一样，可以解决用训练好的神经网络模型进行预测时的维度不匹配问题。

参考链接：https://blog.csdn.net/qq_40183315/article/details/107808112

突然想到一件事，之前在想为什么这种框架里没有设置3种data集？现在看到这个validation和train突然想到！！！！！！！！！整个就叫做一个train，其实分为小弟的train和validation，这是我不断看数据去跳整的部分。为了分离test，甚至都不让test进入，真隔离了。

** plt.pause(1)这又是啥玩意**
就是暂停一会，再继续画。像参考文献这样，加入for循环，保持图像位置不变，调整别的东西以后，就有点像动画？？？
参考文献：https://vimsky.com/examples/usage/matplotlib-pyplot-pause-in-python.html
** plt.set_cmap(‘gray’)有啥用
**
就是显示灰度图的意思

为啥我把这个处理注释掉，结果这么差呢？？
这个是只有黑色和白色的高对比度图片,拒绝背景噪声,阈值可选择
在这里插入图片描述

哦哦哦，又去听了下课。原来训练的时候时黑底白字，现在时白底黑字。要转换一下

黑白反转，效果也一般

然后老师这里用的时高对比度，就上面那个图。

---------0844敲完了p8sequential定义结构

-----0900敲完了p11calss定义结构，去接杯水，休息一下

------0906回来继续写啦

----0913完成p13导入并可视化mnist数据集

—0920完成了P14定义了更复杂的模型；并且验证数据集是单独导入的；对灰度数据进行了处理

-----0929完成了p15，虽然只是换成了用class定义模型结构，但是为了巩固代码，我还是都默写了一遍。

----------------0950完成fashion作业，因为class比sequential更加灵活，所以在task中就只练习了这一个定义模型的方法，去接杯水，休息一下~回来看chap4了！！！！！！！我先git一下
git add --all – ‘:!d.txt’
哎，class4中的txt太大了，传不上去，只好学习如何git add忽略文件

---------1002去接个水，回来继续
在这里插入图片描述
-------11：00完成chap4自制数据集的功能~
去干饭！！！！！！！！！
commit了一下，这次只commit了我自己写的文件，那个大数据集没交。。。