[人工智能] 小案例--利用梯度下降改善网络

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 小案例--利用梯度下降改善网络 -> 正文阅读

[人工智能]小案例--利用梯度下降改善网络

参考《深度学习与图像识别原理与实践》一书P95，代码有所改动
这本书真的好多错误啊！！

小案例–利用梯度下降改善网络

输入一个X（人工识别这个X的图像为狗），让机器自动判断该图像的分类，其中，图像为三分类（类别分别为鸡、猫、狗），真实标签分类为y=[0,0,1](标签已经转化为one-hot类型，代表是狗）。假设我们有一个数据集X，X赋值为[[0.6,0.9]](已经将肉眼识别的狗的图片转化为矩阵，从代码中可以看到X的形状为（1，2），代表的是1行2列

首先，根据题意，我们有

X = np.array([0.6,0.9])
y = np.array([0,0,1])   # 正确的类别

其中X代表的是狗的数据,Y表示正确的分类

建立简单网络类

class simpleNet:
    def __init__(self):
        np.random.seed(0)
        self.W = np.random.randn(2,3)   # 产生符合高斯分布W矩阵，大小为（2，3）

    def forward(self,x):    
        return np.dot(x,self.W)

    # 得到loss值
    def loss(self,x,y):
        z = self.forward(x)
        p = self._softmax(z)
        loss = self.cross_entropy_error(p,y)
        return loss

    # 得到预测的值
    def predict(self,x):
        x = self.forward(x)
        return self._softmax(x)

    # 损失函数
    def cross_entropy_error(self,p,y):
        return np.sum(-y*np.log(p))

    # Softmax分类器，多分类
    def _softmax(self,x):
        exp_x = np.exp(x)
        return exp_x / np.sum(exp_x)

构造函数

随机生成符合高斯分布且大小为（2，3）的矩阵，作为网络结点权重，如

在这里插入图片描述

网络结点图

损失函数

使用的是cross_entropy_error，即交叉熵误差

其公式为：
$Loss=-\sum^{C=3}_{j=1}y_j\log(y\_predict_j)$
其中C为类别数量，y代表对应目标值，y_predict代表本次的预测值。

激活函数

使用的是Softmax分类器,主要用于解决多分类问题。Softmax函数的定义如下所示：
$S_i=\frac{e^{V_i}}{\sum^C_je^{V_j}}$
其中，Vi表示的是分类器前级单元的输出。i表示类别索引，总的类别个数为C。Si表示当前元素的指数与所有元素指数和的比值。

例如：
$V=\begin{pmatrix} -3 \\ 2 \\ -1 \\ 0 \end{pmatrix}$
经过Softmax处理后，数值转化为如下所示的相对概率：
$S=\begin{pmatrix} 0.0057 \\ 0.8390 \\ 0.0418 \\ 0.1135 \end{pmatrix}$
可以清楚的看出不同类别之间的相对概率

接下来我们来看网络预测是否正确

p = net.predict(X)
print('预测值为：',p)
print('预测的类别为(0:鸡、1:猫、2:狗):',np.argmax(p))
print('损失值为：',net.loss(X,y))

在这里插入图片描述

损失值为3.66，且预测类别为鸡（我们要的是狗，即2），需要改善！

利用梯度下降改善网络

我们利用损失函数作为函数，不断计算其导数，利用导数不断向正确值逼近。（这里只是一维的函数而已，求导即可），即利用公式
$\frac{df(x)}{dx}=\lim_{h\rightarrow0}\frac{f(x+h)-f(x-h)}{2h}$
下面为梯度下降详细代码

def numerical_gradient(f,x):
    h = 1e-4    # 0.0001
    grad = np.zeros_like(x)#生成等大小的零矩阵

    it = np.nditer(x,flags=['multi_index'],op_flags=['readwrite'])
    while not it.finished:
        idx = it.multi_index
        temp_val = x[idx]
        x[idx] = temp_val + h
        fxh1 = f(X)     # f(x+h)

        x[idx] = temp_val - h
        fxh2 = f(X)     # f(x-h)
        grad[idx] = (fxh1 - fxh2) / (2*h)

        x[idx] = temp_val # 还原值
        it.iternext()	#迭代下一个

    return grad

def gradient_descent(f,init_x,lr=0.01,step_num=1000):
    x = init_x
    for i in range(step_num):
        grad = numerical_gradient(f,x)
        x -= lr*grad
    return x

f = lambda x:net.loss(x,y)
dw = gradient_descent(f,net.W)  #使用梯度下降对网络W更新

np.nditer迭代数组

multi_index可以获取当前的索引值
readwrite表示可读可写

np.nditer的详情操作请参考https://blog.csdn.net/weixin_44901453/article/details/99562341

numerical_gradient

要注意区分，x为传进去的网络W，X为我们要预测的（狗）

这里书籍中后面所有的X都写成了x，导致我在这里卡了很久。

gradient_descent

lr为超参数，即学习率learning rate，一般选择较小的数

step_num为梯度下降迭代次数，这里为1000

改善网络后结果

print('经过梯度下降后，网络的权值变为：\n',dw)
print('损失值变为：：',net.loss(X,y))
print('预测值为：',net.predict(X))
print('预测类别为：(0:鸡、1:猫、2:狗)',np.argmax(net.predict(X)))

在这里插入图片描述

下面为完整代码

import numpy as np

class simpleNet:
    def __init__(self):
        np.random.seed(0)
        self.W = np.random.randn(2,3)   # 产生符合高斯分布W矩阵，大小为（2，3）

    def forward(self,x):    # 前向传播
        return np.dot(x,self.W)

    def loss(self,x,y):
        z = self.forward(x)
        p = self._softmax(z)
        loss = self.cross_entropy_error(p,y)
        return loss

    def predict(self,x):
        x = self.forward(x)
        return self._softmax(x)

    # 损失函数
    def cross_entropy_error(self,p,y):
        return np.sum(-y*np.log(p))

    # Softmax分类器，多分类
    def _softmax(self,x):
        exp_x = np.exp(x)
        return exp_x / np.sum(exp_x)

net = simpleNet()
print('随机初始化的网络参数为\n',net.W)

X = np.array([0.6,0.9])
print('我们输入张量为X，人眼识别为狗, X=',X)

p = net.predict(X)
print('预测值为：',p)
print('预测的类别为(0:鸡、1:猫、2:狗):',np.argmax(p))

# 这里预测出来是鸡，明显预测错误
# 进一步看一下Loss值
y = np.array([0,0,1])   # 正确的类别
print('损失值为：',net.loss(X,y))
print()
# 计算一下损失值，我们会发现Loss非常大，下面我们使用梯度下降法来对其优化了

def numerical_gradient(f,x):
    h = 1e-4    # 0.0001
    grad = np.zeros_like(x)

    it = np.nditer(x,flags=['multi_index'],op_flags=['readwrite'])
    while not it.finished:
        idx = it.multi_index
        temp_val = x[idx]
        x[idx] = temp_val + h
        fxh1 = f(X)     # f(x+h)

        x[idx] = temp_val - h
        fxh2 = f(X)     # f(x-h)
        grad[idx] = (fxh1 - fxh2) / (2*h)

        x[idx] = temp_val # 还原值
        it.iternext()

    return grad

def gradient_descent(f,init_x,lr=0.01,step_num=1000):
    x = init_x
    for i in range(step_num):
        grad = numerical_gradient(f,x)
        x -= lr*grad
    return x

f = lambda x:net.loss(x,y)
dw = gradient_descent(f,net.W)  #使用梯度下降对网络W更新
print('经过梯度下降后，网络的权值变为：\n',dw)
print('损失值变为：：',net.loss(X,y))
print('预测值为：',net.predict(X))
print('预测类别为：(0:鸡、1:猫、2:狗)',np.argmax(net.predict(X)))

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2021-07-28 07:45:54 更:2021-07-28 07:47:32

360图书馆购物三丰科技阅读网日历万年历 2025年10日历

-2025/10/16 23:07:50-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码