深度学习 - PyTorch模型预测 (TorchModelPredictBatchOp) - 《Alink 1.5.6 文档 - 帮助手册 - 教程》

功能介绍
- 使用方式
参数说明
- 模型路径说明
代码示例
- Python 代码

Java 类名：com.alibaba.alink.operator.batch.pytorch.TorchModelPredictBatchOp
Python 类名：TorchModelPredictBatchOp

功能介绍

加载 TorchScript 模型进行预测。

使用方式

模型路径modelPath需要是一个通过 torch.jit 导出的模型文件路径。
参与模型预测的数据通过参数 selectedCols 设置，需要注意以下几点：

TorchScript 模型调用 forward 方法时是通过位置来传入参数的，所以 selectedCols 中各列的顺序是有意义的。
所选择的列的类型需要是 Alink Tensor 类型或者 4 种基本数据类型（Long, Double, Boolean, String 及其兼容类型），不接受其他类型。

模型输出信息通过参数 outputSchemaStr 指定，包括输出列名以及名称，需要注意以下几点：

输出列的数量需要与模型输出结果匹配。
输出类型可以是 Alink Tensor 类型或者 Alink 支持的类型，如果从模型预测输出的结果转换到指定类型失败那么将报错；暂不支持列表或字典类型。

组件使用的是 PyTorch 1.8.1 版本，当有 GPU 时，自动使用 GPU 进行推理，否则使用 CPU 进行推理。

参数说明

| 名称 | 中文名称 | 描述 | 类型 | 是否必须？ | 取值范围 | 默认值 | | —- | —- | —- | —- | —- | —- | —- |

模型路径说明

模型路径可以是以下形式：

本地文件：file:// 加绝对路径，例如 file:///tmp/dnn.py；
Java 包中的资源文件：res:// 加路径，例如 res:///dnn.py；
http/https 文件：http:// 或 https:// 路径；
OSS 文件：oss:// 加路径和 Endpoint 和 access key
等信息，例如oss://bucket/xxx/xxx/xxx.py?host=xxx&access_key_id=xxx&access_key_secret=xxx；
HDFS 文件：hdfs:// 加路径；
代码示例
以下代码仅用于示意，可能需要修改部分代码或者配置环境后才能正常运行！
Python 代码
``` test = AkSourceBatchOp()\ .setFilePath(“https://alink-release.oss-cn-beijing.aliyuncs.com/data-files/mnist_test_vector.ak“);

test = VectorToTensorBatchOp()\ .setTensorDataType(“float”)\ .setTensorShape([1, 1, 28, 28])\ .setSelectedCol(“vec”)\ .setOutputCol(“tensor”)\ .setReservedCols([“label”])\ .linkFrom(test)

predictor = TorchModelPredictBatchOp()\ .setModelPath(“https://alink-release.oss-cn-beijing.aliyuncs.com/data-files/mnist_model_pytorch.pt")\ .setSelectedCols([“tensor”])\ .setOutputSchemaStr(“probabilities FLOAT_TENSOR”)

test = predictor.linkFrom(test).select(“label, probabilities”) test.print()

### Java 代码

import com.alibaba.alink.operator.batch.BatchOperator; import com.alibaba.alink.operator.batch.dataproc.VectorToTensorBatchOp; import com.alibaba.alink.operator.batch.pytorch.TorchModelPredictBatchOp; import com.alibaba.alink.operator.batch.source.AkSourceBatchOp; import org.junit.Test;

public class TorchModelPredictBatchOpTest {

@Test
public void testTorchModelPredictBatchOp() throws Exception {
    BatchOperator.setParallelism(1);
    BatchOperator <?> test = new AkSourceBatchOp()
        .setFilePath("https://alink-release.oss-cn-beijing.aliyuncs.com/data-files/mnist_test_vector.ak");
    test = new VectorToTensorBatchOp()
        .setTensorDataType("float")
        .setTensorShape(1, 1, 28, 28)
        .setSelectedCol("vec")
        .setOutputCol("tensor")
        .setReservedCols("label")
        .linkFrom(test);
    BatchOperator <?> predictor = new TorchModelPredictBatchOp()
        .setModelPath("https://alink-release.oss-cn-beijing.aliyuncs.com/data-files/mnist_model_pytorch.pt")
        .setSelectedCols("tensor")
        .setOutputSchemaStr("probabilities FLOAT_TENSOR");
    test = predictor.linkFrom(test).select("label, probabilities");
    test.print();
}

}

```

PyTorch模型预测 (TorchModelPredictBatchOp)

功能介绍

使用方式

参数说明

模型路径说明

代码示例

Python 代码