pytorch学习笔记(二):gradient

来源:互联网 发布:学java看什么视频 编辑:程序博客网 时间:2024/06/06 16:42

gradient

BP的时候,pytorch是将Variable的梯度放在Variable对象中的,我们随时都可以使用Variable.grad得到对应Variablegrad。刚创建Variable的时候,它的grad属性是初始化为0.0的。

import torchfrom torch.autograd import Variablew1 = Variable(torch.Tensor([1.0,2.0,3.0]),requires_grad=True)#需要求导的话,requires_grad=True属性是必须的。w2 = Variable(torch.Tensor([1.0,2.0,3.0]),requires_grad=True)print(w1.grad)print(w2.grad)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
Variable containing: 0 0 0[torch.FloatTensor of size 3]Variable containing: 0 0 0[torch.FloatTensor of size 3]

从下面这两段代码可以看出,Variablegrad是累加的即: Variable.grad=Variable.grad+new_grad

d = torch.mean(w1)d.backward()w1.grad
  • 1
  • 2
  • 3
  • 1
  • 2
  • 3
Variable containing: 0.3333 0.3333 0.3333[torch.FloatTensor of size 3]
d.backward()w1.grad
  • 1
  • 2
  • 1
  • 2
Variable containing: 0.6667 0.6667 0.6667[torch.FloatTensor of size 3]

既然累加的话,那我们如何置零呢?

w1.grad.data.zero_()w1.grad
  • 1
  • 2
  • 1
  • 2
Variable containing: 0 0 0[torch.FloatTensor of size 3]

通过上面的方法,就可以将grad置零。通过打印出来的信息可以看出,w1.grad其实是Tensor。现在可以更清楚的理解一下VariableTensor之间的关系,上篇博客已经说过,VariableTensor的一个wrapper,那么到底是什么样的wrapper呢?从目前的掌握的知识来看,一个是保存weightsTensor,一个是保存gradVariableVariable的一些运算,实际上就是里面的Tensor的运算。 
pytorch中的所有运算都是基于Tensor的,Variable只是一个WrapperVariable的计算的实质就是里面的Tensor在计算。Variable默认代表的是里面存储的Tensorweights)。理解到这,我们就可以对grad进行随意操作了。

# 获得梯度后,如何更新learning_rate = 0.1#w1.data -= learning_rate * w1.grad.data 与下面式子等价w1.data.sub_(learning_rate*w1.grad.data)# w1.data是获取保存weights的Tensor
  • 1
  • 2
  • 3
  • 4
  • 1
  • 2
  • 3
  • 4

这里更新的时候为什么要用Tensor更新,为什么不直接用Variable? 
Variable更多是用在feedforward中的,因为feedforward是需要记住各个Tensor之间联系的,这样,才能正确的bpTensor不会记录路径。而且,如果使用Variable操作的话,就会造成循环图了(猜测)。

0 0
原创粉丝点击