张量

原文: https://pytorch.org/tutorials/beginner/blitz/tensor_tutorial.html#sphx-glr-beginner-blitz-tensor-tutorial-py

张量如同数组和矩阵一样, 是一种特殊的数据结构。在PyTorch中, 神经网络的输入、输出以及网络的参数等数据, 都是使用张量来进行描述。

张量的使用和Numpy中的ndarrays很类似, 区别在于张量可以在GPU或其它专用硬件上运行, 这样可以得到更快的加速效果。如果你对ndarrays很熟悉的话, 张量的使用对你来说就很容易了。如果不太熟悉的话, 希望这篇有关张量API的快速入门教程能够帮到你。

  1. import torch
  2. import numpy as np

张量初始化

张量有很多种不同的初始化方法, 先来看看四个简单的例子:

1. 直接生成张量

由原始数据直接生成张量, 张量类型由原始数据类型决定。

  1. data = [[1, 2], [3, 4]]
  2. x_data = torch.tensor(data)

2. 通过Numpy数组来生成张量

由已有的Numpy数组来生成张量(反过来也可以由张量来生成Numpy数组, 参考张量与Numpy之间的转换)。

  1. np_array = np.array(data)
  2. x_np = torch.from_numpy(np_array)

3. 通过已有的张量来生成新的张量

新的张量将继承已有张量的数据属性(结构、类型), 也可以重新指定新的数据类型。

  1. x_ones = torch.ones_like(x_data) # 保留 x_data 的属性
  2. print(f"Ones Tensor: \n {x_ones} \n")
  3. x_rand = torch.rand_like(x_data, dtype=torch.float) # 重写 x_data 的数据类型
  4. int -> float
  5. print(f"Random Tensor: \n {x_rand} \n")

显示:

  1. Ones Tensor:
  2. tensor([[1, 1],
  3. [1, 1]])
  4. Random Tensor:
  5. tensor([[0.0381, 0.5780],
  6. [0.3963, 0.0840]])

4. 通过指定数据维度来生成张量

shape是元组类型, 用来描述张量的维数, 下面3个函数通过传入shape来指定生成张量的维数。

  1. shape = (2,3,)
  2. rand_tensor = torch.rand(shape)
  3. ones_tensor = torch.ones(shape)
  4. zeros_tensor = torch.zeros(shape)
  5. print(f"Random Tensor: \n {rand_tensor} \n")
  6. print(f"Ones Tensor: \n {ones_tensor} \n")
  7. print(f"Zeros Tensor: \n {zeros_tensor}")

显示:

  1. Random Tensor:
  2. tensor([[0.0266, 0.0553, 0.9843],
  3. [0.0398, 0.8964, 0.3457]])
  4. Ones Tensor:
  5. tensor([[1., 1., 1.],
  6. [1., 1., 1.]])
  7. Zeros Tensor:
  8. tensor([[0., 0., 0.],
  9. [0., 0., 0.]])

张量属性

从张量属性我们可以得到张量的维数、数据类型以及它们所存储的设备(CPU或GPU)。

来看一个简单的例子:

  1. tensor = torch.rand(3,4)
  2. print(f"Shape of tensor: {tensor.shape}")
  3. print(f"Datatype of tensor: {tensor.dtype}")
  4. print(f"Device tensor is stored on: {tensor.device}")

显示:

  1. Shape of tensor: torch.Size([3, 4]) # 维数
  2. Datatype of tensor: torch.float32 # 数据类型
  3. Device tensor is stored on: cpu # 存储设备

张量运算

有超过100种张量相关的运算操作, 例如转置、索引、切片、数学运算、线性代数、随机采样等。更多的运算可以在这里查看

所有这些运算都可以在GPU上运行(相对于CPU来说可以达到更高的运算速度)。如果你使用的是Google的Colab环境, 可以通过 Edit > Notebook Settings 来分配一个GPU使用。

  1. # 判断当前环境GPU是否可用, 然后将tensor导入GPU内运行
  2. if torch.cuda.is_available():
  3. tensor = tensor.to('cuda')

光说不练假把式, 接下来的例子一定要动手跑一跑。如果你对Numpy的运算非常熟悉的话, 那tensor的运算对你来说就是小菜一碟。

1. 张量的索引和切片

  1. tensor = torch.ones(4, 4)
  2. tensor[:,1] = 0 # 将第1列(从0开始)的数据全部赋值为0
  3. print(tensor)

显示:

  1. tensor([[1., 0., 1., 1.],
  2. [1., 0., 1., 1.],
  3. [1., 0., 1., 1.],
  4. [1., 0., 1., 1.]])

2. 张量的拼接

你可以通过torch.cat方法将一组张量按照指定的维度进行拼接, 也可以参考torch.stack方法。这个方法也可以实现拼接操作, 但和torch.cat稍微有点不同。

  1. t1 = torch.cat([tensor, tensor, tensor], dim=1)
  2. print(t1)

显示:

  1. tensor([[1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.],
  2. [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.],
  3. [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.],
  4. [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.]])

3. 张量的乘积和矩阵乘法

  1. # 逐个元素相乘结果
  2. print(f"tensor.mul(tensor): \n {tensor.mul(tensor)} \n")
  3. # 等价写法:
  4. print(f"tensor * tensor: \n {tensor * tensor}")

显示:

  1. tensor.mul(tensor):
  2. tensor([[1., 0., 1., 1.],
  3. [1., 0., 1., 1.],
  4. [1., 0., 1., 1.],
  5. [1., 0., 1., 1.]])
  6. tensor * tensor:
  7. tensor([[1., 0., 1., 1.],
  8. [1., 0., 1., 1.],
  9. [1., 0., 1., 1.],
  10. [1., 0., 1., 1.]])

下面写法表示张量与张量的矩阵乘法:

  1. print(f"tensor.matmul(tensor.T): \n {tensor.matmul(tensor.T)} \n")
  2. # 等价写法:
  3. print(f"tensor @ tensor.T: \n {tensor @ tensor.T}")

显示:

  1. tensor.matmul(tensor.T):
  2. tensor([[3., 3., 3., 3.],
  3. [3., 3., 3., 3.],
  4. [3., 3., 3., 3.],
  5. [3., 3., 3., 3.]])
  6. tensor @ tensor.T:
  7. tensor([[3., 3., 3., 3.],
  8. [3., 3., 3., 3.],
  9. [3., 3., 3., 3.],
  10. [3., 3., 3., 3.]])

4. 自动赋值运算

自动赋值运算通常在方法后有 _ 作为后缀, 例如: x.copy_(y), x.t_()操作会改变 x 的取值。

  1. print(tensor, "\n")
  2. tensor.add_(5)
  3. print(tensor)

显示:

  1. tensor([[1., 0., 1., 1.],
  2. [1., 0., 1., 1.],
  3. [1., 0., 1., 1.],
  4. [1., 0., 1., 1.]])
  5. tensor([[6., 5., 6., 6.],
  6. [6., 5., 6., 6.],
  7. [6., 5., 6., 6.],
  8. [6., 5., 6., 6.]])

注意:

自动赋值运算虽然可以节省内存, 但在求导时会因为丢失了中间过程而导致一些问题, 所以我们并不鼓励使用它。

Tensor与Numpy的转化

张量和Numpy array数组在CPU上可以共用一块内存区域, 改变其中一个另一个也会随之改变。 1. 由张量变换为Numpy array数组

  1. t = torch.ones(5)
  2. print(f"t: {t}")
  3. n = t.numpy()
  4. print(f"n: {n}")

显示:

  1. t: tensor([1., 1., 1., 1., 1.])
  2. n: [1. 1. 1. 1. 1.]

修改张量的值,则Numpy array数组值也会随之改变。

  1. t.add_(1)
  2. print(f"t: {t}")
  3. print(f"n: {n}")

显示:

  1. t: tensor([2., 2., 2., 2., 2.])
  2. n: [2. 2. 2. 2. 2.]

2. 由Numpy array数组转为张量

  1. n = np.ones(5)
  2. t = torch.from_numpy(n)

修改Numpy array数组的值,则张量值也会随之改变。

  1. np.add(n, 1, out=n)
  2. print(f"t: {t}")
  3. print(f"n: {n}")

显示:

  1. t: tensor([2., 2., 2., 2., 2.], dtype=torch.float64)
  2. n: [2. 2. 2. 2. 2.]

脚本的总运行时间:(0 分钟 0.045 秒)

下载 Python 源码:tensor_tutorial.py

下载 Jupyter 笔记本:tensor_tutorial.ipynb

由 Sphinx 画廊生成的画廊