《Pytorch - 逻辑回归模型》

科技2022-07-21 116

2020年10月4号，依然在家学习。今天是我写的第二个 Pytorch程序，从今天起也算是入门了。这里是简单的实现了逻辑回归开始。

回顾线性回归，线性模型如下 y = wx + b，图画的丑了，意思到了就行。

回顾逻辑回归，线性模型如下 y =σ(wx + b) ，图画的丑了，意思到了就行。

也就是逻辑回归其实就是在之前的线性回归的基础上增加了一个 sigmoid函数层。而且误差损失函数也会发生变化，需要使用二分类的误差损失函数，具体细节在很早的博文机器学习里面有介绍，这里就不多赘述了。

话不多说，我就直接上代码实例描述，代码的注释我都是用中文直接写的。

import torch import torch.nn.functional as F # Step 1: ========创建模型======== # 定义一个类，继承自 torch.nn.Module，torch.nn.Module是callable的类 # 在整个类里面重新定义一个逻辑回归模型 y = sigmod(wx+b)，也可以理解成内置一个线性层。 # 整个子类需要重写forward函数， class LogisticRegressionModel(torch.nn.Module): def __init__(self): # 调用父类的初始化函数，必须要的 super(LogisticRegressionModel, self).__init__() # 创建一个线性层，作为内置层，也是实例化一个torch.nn.Linear对象，输入数据是一维的，输出数据也是一维的，默认包含偏置参数 # torch.nn.Linear也是callable的类 self.linearLayer = torch.nn.Linear(1, 1) def forward(self, x): # 使用这个包下面的sigmoid函数做激活 y_out = F.sigmoid(self.linearLayer(x)) return y_out # 创建和实例化一个整个模型类的对象 Logistic_Model = LogisticRegressionModel() # 打印出整个模型 print(Logistic_Model) # Step 2: ========定义损失函数和优化器======== # 定义一个均方差误差损失函数 binary classification error loss Logistic_Criterion = torch.nn.BCELoss(size_average=True) # 创建一个优化器，是用来做参数训练的，或者说是反向传播后更新参数，线性回归一般选择随机梯度下降，当然还有其他的梯度下降的方式。 # lr 就是learning rate，把模型的所有参数都交给优化器，反向传播中，优化器会递归地计算参数的偏导数以及做参数更新。 Logistic_Optimizer = torch.optim.SGD(Logistic_Model.parameters(), lr=0.01) # Step 3: ========得到数据======== # 为了方便演示和学习，这里我随意构造几个数据 x_data = torch.Tensor([[1.0], [2.0], [3.0], [4.0], [5.0], [6.0], [7.0], [8.0]]) y_data = torch.Tensor([[0], [0], [0], [0], [1], [1], [1], [1]]) # Step 4: ========开始训练======== # 迭代进行训练 iteration = 100 for itr in range(iteration): # 计算前向传播，也就是计算输出 # 由于模型是callable的，最后会自动调用__callable__函数，再其中就有一个是forward函数调用。 y_output = Logistic_Model(x_data) # 得到损失值 loss = Logistic_Criterion(y_output, y_data) print("in the ", itr, "th iteration, loss is", loss.item()) # 反向传播，也就是对参数进行训练，需要注意的是，需要把优化其中上一次计算的梯度值清0 Logistic_Optimizer.zero_grad() # 计算反向的各个参数的偏导数 loss.backward() # 更新参数 Logistic_Optimizer.step() # 打印出参数 print("w is: ", Logistic_Model.linearLayer.weight.item()) print("b is: ", Logistic_Model.linearLayer.bias.item())

Processed: 0.009, SQL: 8