相关知识
1、分类问题不同于线性回归,是输出属于每一个类别的概率。概率最大的就是最后的类别。 2、sigmoid函数 使用sigmoid函数将线性回归里的输出值[-无穷,+无穷]映射到[0,1]。 其他的sigmoid函数: 这些函数满足的条件: 函数值有极限、都是单调的增函数、都是饱和函数。 逻辑回归模型: 损失函数的变化: 这里使用的是交叉熵损失,交叉熵损失描述的的是两个分布之间的差异,越大越好,这里加了一负号,所以是越小越好。
代码
代码部分和线性回归模型差不多还是分为四步。
一、Prepare dataset(准备数据集)
import torch
import numpy as np
import matplotlib.pyplot as plt
x_data = torch.Tensor([[1.0], [2.0], [3.0]])
y_data = torch.Tensor([[0], [0], [1]])
二、Design model using Class(使用类设计模型)
class LogisticRegressionModel(torch.nn.Module):
def __init__(self):
super(LogisticRegressionModel, self).__init__()
self.linear = torch.nn.Linear(1, 1)
def forward(self, x):
y_pred = torch.sigmoid(self.linear(x))
return y_pred
model = LogisticRegressionModel()
三、Construct Loss and Optimizer(构造损失函数和优化器)
criterion = torch.nn.BCELoss(reduction='sum')
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
四、Training Cycle(训练循环)
for epoch in range(1000):
y_pred = model(x_data)
loos = criterion(y_pred, y_data)
print(epoch, loos.item())
optimizer.zero_grad()
loos.backward()
optimizer.step()
这四步与线性回归基本一致,不一样的地方有:1、数据的输出,不再是输出一个值,而是输出一个类别的概率;2、损失函数的选择,线性回归用的是MSELoss,这里用的是BCELoss;3、在前馈的过程中,需要将线性单元的输出作为输入送入sigmoid函数中(y_pred =torch.sigmoid(self.linear(x))),目的是将实数空间的值映射到0到1之间。
最后测试一下训练好的这个模型。代码如下:
x = np.linspace(0, 20, 200)
x_t = torch.Tensor(x).view((200, 1))
y_t = model(x_t)
y = y_t.data.numpy()
plt.plot(x, y)
plt.plot([0, 20], [0.5, 0.5], c='r')
plt.xlabel('Hours')
plt.ylabel('Probability of Pass')
plt.grid()
plt.show()
结果如图示:
|