机器学习 PyTorch
在大多数情况下,基本都是以类的形式实现神经网络。
大多数情况下创建一个继承自 Pytorch 中的 nn.Module 的类,这样可以使用 Pytorch 提供的许多高级 API,而无需自己实现。
下面展示了一个可以从nn.Module创建的最简单的神经网络类的示例。基于 nn.Module的类的最低要求是覆盖__init__()方法和forward()方法。
在这个类中,定义了一个简单的线性网络,具有两个输入和一个输出,并使用 Sigmoid()函数作为网络的激活函数。
import torchfrom torch import nnclass LinearRegression(nn.Module):def __init__(self):#继承父类构造函数super(LinearRegression, self).__init__()#输入和输出的维度都是1self.linear = nn.Linear(1, 1)def forward(self, x):out = self.linear(x)return out
现在测试一下模型。
# 创建LinearRegression()的实例model = LinearRegression()print(model)# 输出如下LinearRegression((linear): Linear(in_features=1, out_features=1, bias=True))
现在让定义一个损失函数和优化函数。
model = LinearRegression()#实例化对象num_epochs = 1000#迭代次数learning_rate = 1e-2#学习率0.01Loss = torch.nn.MSELoss()#损失函数optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)#优化函数
创建一个由方程产生的数据集,并通过函数制造噪音
import torchfrom matplotlib import pyplot as pltfrom torch.autograd import Variablefrom torch import nn# 创建数据集 unsqueeze 相当于x = Variable(torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1))y = Variable(x * 2 + 0.2 + torch.rand(x.size()))plt.scatter(x.data.numpy(),y.data.numpy())plt.show()

关于torch.unsqueeze函数解读。
>>> x = torch.tensor([1, 2, 3, 4])>>> torch.unsqueeze(x, 0)tensor([[ 1, 2, 3, 4]])>>> torch.unsqueeze(x, 1)tensor([[ 1],[ 2],[ 3],[ 4]])
遍历每次epoch,计算出loss,反向传播计算梯度,不断的更新梯度,使用梯度下降进行优化。
for epoch in range(num_epochs):# 预测y_pred= model(x)# 计算lossloss = Loss(y_pred, y)#清空上一步参数值optimizer.zero_grad()#反向传播loss.backward()#更新参数optimizer.step()if epoch % 200 == 0:print("[{}/{}] loss:{:.4f}".format(epoch+1, num_epochs, loss))plt.scatter(x.data.numpy(), y.data.numpy())plt.plot(x.data.numpy(), y_pred.data.numpy(), 'r-',lw=5)plt.text(0.5, 0,'Loss=%.4f' % loss.data.item(), fontdict={'size': 20, 'color': 'red'})plt.show()
####结果如下####[1/1000] loss:4.2052[201/1000] loss:0.2690[401/1000] loss:0.0925[601/1000] loss:0.0810[801/1000] loss:0.0802

[w, b] = model.parameters()print(w,b)# Parameter containing:tensor([[2.0036]], requires_grad=True) Parameter containing:tensor([0.7006], requires_grad=True)
这里的b=0.7,等于0.2 + torch.rand(x.size()),经过大量的训练torch.rand()一般约等于0.5。
