Java 类名:com.alibaba.alink.operator.batch.image.ReadImageToTensorBatchOp
Python 类名:ReadImageToTensorBatchOp

功能介绍

将图片列转换为张量。

参数说明

| 名称 | 中文名称 | 描述 | 类型 | 是否必须? | 取值范围 | 默认值 | | —- | —- | —- | —- | —- | —- | —- |

| outputCol | 输出结果列列名 | 输出结果列列名,必选 | String | ✓ | | |

| relativeFilePathCol | 文件路径列 | 文件路径列 | String | ✓ | 所选列类型为 [STRING] | |

| rootFilePath | 文件路径 | 文件路径 | String | ✓ | | |

| imageHeight | 图片高度 | 图片高度 | Integer | | | |

| imageWidth | 图片宽度 | 图片宽度 | Integer | | | |

| reservedCols | 算法保留列名 | 算法保留列 | String[] | | | null |

代码示例

Python 代码

  1. df_data = pd.DataFrame([
  2. 'sphx_glr_plot_scripted_tensor_transforms_001.png'
  3. ])
  4. batch_data = BatchOperator.fromDataframe(df_data, schemaStr = 'path string')
  5. ReadImageToTensorBatchOp()\
  6. .setRootFilePath("https://pytorch.org/vision/stable/_images/")\
  7. .setRelativeFilePathCol("path")\
  8. .setOutputCol("tensor")\
  9. .linkFrom(batch_data)\
  10. .print()

Java 代码

  1. import org.apache.flink.types.Row;
  2. import com.alibaba.alink.operator.batch.source.MemSourceBatchOp;
  3. import org.junit.Test;
  4. import java.util.Collections;
  5. import java.util.List;
  6. public class ReadImageToTensorBatchOpTest {
  7. @Test
  8. public void testReadImageToTensorBatchOp() throws Exception {
  9. List <Row> data = Collections.singletonList(
  10. Row.of("sphx_glr_plot_scripted_tensor_transforms_001.png")
  11. );
  12. MemSourceBatchOp memSourceBatchOp = new MemSourceBatchOp(data, "path string");
  13. new ReadImageToTensorBatchOp()
  14. .setRootFilePath("https://pytorch.org/vision/stable/_images/")
  15. .setRelativeFilePathCol("path")
  16. .setOutputCol("tensor")
  17. .linkFrom(memSourceBatchOp)
  18. .print();
  19. }
  20. }

运行结果

| path | tensor |
|—————————————————————————+————————————————|
| sphx_glr_plot_scripted_tensor_transforms_001.png | FLOAT#250,520,4#1.0 1.0 1.0… |