up主 刘二大人
视频链接?刘二大人的个人空间_哔哩哔哩_Bilibili
多维输入
如下图为糖尿病数据集, 输入为10个样本, 每个样本具有8维特征(怀孕次数,血糖,血压,皮脂厚度,胰岛素,BMI身体质量指数,糖尿病遗传函数,年龄),最后一列为标签(结果),0表示未患糖尿病,1表示患有糖尿病。

逻辑回归模型
由于输入数据维数增多, 而预测值是标量, 所以模型需要使用矩阵形式做计算


?
说明:?
1. 乘的权重(w)都一样,加的偏置(b)一样。b变成矩阵时会使用python广播机制。神经网络的参数w和b是网络需要学习的,其他是已知的。
2. 学习能力越强,有可能会把输入样本中噪声的规律也学到, 模型最好是有泛化能力。
神经网络
多层神经网络, 每一层线性变换加上sigmoid函数(激活函数), 将线性变换变成非线性变换。
如下图所示, 输入为8维, 通过一层神经网络, 输出为6维

?如下图所示,可以通过搭建多层神经网络模型, 最终输出标量。
糖尿病预测
import numpy as np
import torch
import matplotlib.pyplot as plt
class Model(torch.nn.Module):
def __init__(self):
super(Model, self).__init__()
self.linear1 = torch.nn.Linear(8, 6)
self.linear2 = torch.nn.Linear(6, 4)
self.linear3 = torch.nn.Linear(4, 1)
self.sigmoid = torch.nn.Sigmoid()
# self.sigmoid = torch.nn.ReLU()
def forward(self, x):
x = self.sigmoid(self.linear1(x))
x = self.sigmoid(self.linear2(x))
x = self.sigmoid(self.linear3(x))
return x
model = Model()
"""
GPU 1080/2080 仅支持到32位float
这里使用的数据集是糖尿病数据集(二分类问题), x为N*8, y表示是否患病(0/1)
"""
xy = np.loadtxt('data\diabetes.csv.gz', delimiter=',', dtype=np.float32)
""" torch.from_numpy: 将数组array转换为张量Tensor """
x_data = torch.from_numpy(xy[:, :-1])
y_data = torch.from_numpy(xy[:, [-1]])
criterion = torch.nn.BCELoss(size_average=True)
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
epoch_list = []
loss_list = []
for epoch in range(1000):
# Forward
y_pred = model(x_data)
loss = criterion(y_pred, y_data)
print(epoch, loss.item())
# Backward
optimizer.zero_grad()
loss.backward()
# Update
optimizer.step()
epoch_list.append(epoch)
loss_list.append(loss)
plt.plot(epoch_list, loss_list)
plt.xlabel('epoch')
plt.ylabel('Loss')
plt.show()
结果显示:

|