[人工智能] Python机器学习日记（八）

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> Python机器学习日记（八） -> 正文阅读

[人工智能]Python机器学习日记（八）

神经网络

“多层感知器”--MLP算法，也被称为前馈神经网络。

首先看一下一个线性模型的一般公式：

? ? ? ? ? ? ? ? ? ? ? ? ? ? ?y^ = w[0]*x[0]+w[1]*x[1]+...+w[p]*x[p]+b

其中y^表示对y的估计值，x[0]到x[p]是样本特征值，w表示每个特征值的权重，y-hat可以看成是所有特征值的加权求和。用下面这个图来表示这一过程。

?在MLP模型中，算法在过程里添加了隐藏层，然后在隐藏层重复进行上述加权求和计算，最后再把隐藏层所计算的结果用来生成最终结果，如下图所示：

?这样模型要学习的特征系数或者说权重，就会多很多了。在每一个输入的特征和隐藏单元之间都有一个系数，每个隐藏单元和最终结果之间也都有一个系数。

为了让模型变得比普通线性模型更强大，需要进行一些其他的处理：在生成隐藏层后，我们要对结果进行非线性矫正（relu）或者双曲正切处理（tanh）通过这两种方式处理后的结果来计算最终结果y。

接下来进行代码展示

import numpy as np
import  matplotlib.pyplot as plt

line = np.linspace(-5,5,200)
#生成一个等差数列

plt.plot(line,np.tanh(line),label='tanh')
plt.plot(line,np.maximum(line,0),label='relu')
#画出非线性矫正的图形表示

plt.legend(loc='best')
# 设置图注位置
plt.xlabel('x')
plt.ylabel('relu(x) and tanh(x)')
plt.show()

?根据图中信息可以看出，tanh函数把特征x的值压缩进到-1,1的区间内，-1代表的是x中较小的值，而1代表较大的值。relu函数则把小于0的x值全部去掉，用0代替，这样刚才的公式经过tanh处理后会变成：

?h[0]=tanh(?w[0]*x[0]+w[1]*x[1]+...+w[p]*x[p]+b)

?h[1]=tanh(?w[0]*x[0]+w[1]*x[1]+...+w[p]*x[p]+b)

?h[2]=tanh(?w[0]*x[0]+w[1]*x[1]+...+w[p]*x[p]+b)

...

y^ = v[0]h[1]+v[1]h[1]+...+v[n]h[n]

在权重系数w之外，我们又多了一个权重系数v，用来通过隐藏层h来计算y-hat的结果

w,v都是通过对数据的学习得出的，用户要设置的参数就是隐藏层中节点的数量。在大量的数据中往往要添加更多的隐藏层，如下图所示：

?这也是后续要学习的“深度学习”中“深度”的来源

神经网络的参数设置

以MLP算法中的MLP分类器为例，研究一下该分类器模型的使用方法：

from sklearn.neural_network import MLPClassifier
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
wine = load_wine()
X = wine.data[:,:2]
y = wine.target
#下面拆分数据集
X_train,X_test,y_train,y_test = train_test_split(X,y,random_state=0)
#定义分类器 
mlp = MLPClassifier(solver='lbfgs')
mlp.fit(X_train,y_train)

在这里介绍一下hidden_layer_sizes参数，默认情况下值为【100，】意味着，模型中只有一个隐藏层，而隐藏层的节点数是100，如果将其定义为【10,10】那就意味着模型中有两个隐藏层，且每层有10个节点。接下来用图像展示一下MLP分类的情况：

import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap

#使用不同色块表示不同分类
cmap_light = ListedColormap(['#FFAAAA','#AAFFAA','#AAAAFF'])
cmap_blod = ListedColormap(['#FF0000','#00FF00','#0000FF'])
x_min,x_max = X_train[:,0].min()-1,X_train[:,0].max()+1
y_min,y_max = X_train[:,1].min()-1,X_train[:,1].max()+1
xx,yy = np.meshgrid(np.arange(x_min,x_max,.02),np.arange(y_min,y_max,.02))
Z = mlp.predict(np.c_[xx.ravel(),yy.ravel()])

Z = Z.reshape(xx.shape)
plt.figure()
plt.pcolormesh(X,yy,Z,cmap=cmap_light)

#将数据特征用散点图表示出来
plt.scatter(X[:.0],X[:,1],c=y,edgecolors='k',s=60)
plt.xlim(xx.min(),xx.max())
plt.ylim(yy.min(),yy.max())
plt.title("MLPClassifier:solver=lbfgs")
plt.show()

?接下来试着把隐藏层的节点数变少，将节点数变为10

节点数为10的时候，决定边界丢失了很多细节。在每一个隐藏层当中，节点数就代表了决定边界中最大的直线数，这个数值越大没决定边界看起来越平滑。增加隐藏层的数量和把activation参数改为tanh都可以让决定边界更细腻。?接下来试着增加隐藏层数量。

?接下来再使用cativation=‘tanh’

?这时边界完全变成了平滑的曲线，这就是对样本特征进行双曲线正切化后的结果，还可以通过调节alpha的值来进行模型复杂度控制。下面把alpha的值增加到1：

?增加alpha参数的值会加大模型正则化的程度，也就是会让模型更加的简单。在神经算法网络中，样本特征的权重是在模型开始学习前就已经随机生成的，而随机生成的权重会导致模型的形态也完全不一样。只要模型的复杂度不变，期预测结果的准确率也不会受到什么影响。

神经网络实例----手写识别

from sklearn.datasets import fetch_openml
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
mnist = fetch_openml('mnist_784')
X,y = mnist["data"],mnist["target"]
X_train,X_test,y_train,y_test = train_test_split(X,y,train_size=5000,test_size=1000,random_state=62)

mlp_hw = MLPClassifier(solver='lbfgs',hidden_layer_sizes=[100,100],activation='relu',
                       alpha=1e-5,random_state=62)
mlp_hw.fit(X_train,y_train)
print('测试数据集得分：{:.2f}'.format(mlp_hw.score(X_test,y_test)*100))

接下来将测试图像转化为模型可读取的numpy数组?

from PIL import Image
image = Image.open('4.png').convert('F')
image = image.resize((28,28))
#调整图像大小
arr=[]
#将图像中的像素作为预测数据点的特征
for i in range(28):
    for j in range(28):
        pixel = 1.0 - float(image.getpixel((j,i)))/255.
        arr.append(pixel)

arr1 = np.array(arr).reshape(1,-1)
print('图中的数字式：{:,.0f}'.format(mlp_hw.predict(arr1)[0]))

输出结束

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的