Java 类名:com.alibaba.alink.operator.batch.source.TextSourceBatchOp
Python 类名:TextSourceBatchOp

功能介绍

按行读取文件数据

参数说明

名称 中文名称 描述 类型 是否必须? 取值范围 默认值
filePath 文件路径 文件路径 String
ignoreFirstLine 是否忽略第一行数据 是否忽略第一行数据 Boolean false
textCol 文本列名称 文本列名称 String “text”

代码示例

Python 代码

  1. from pyalink.alink import *
  2. import pandas as pd
  3. useLocalEnv(1)
  4. URL = "https://alink-test-data.oss-cn-hangzhou.aliyuncs.com/iris.csv"
  5. data = TextSourceBatchOp().setFilePath(URL).setTextCol("text")
  6. data.print()

Java 代码

  1. import com.alibaba.alink.operator.batch.BatchOperator;
  2. import com.alibaba.alink.operator.batch.source.TextSourceBatchOp;
  3. import org.junit.Test;
  4. public class TextSourceBatchOpTest {
  5. @Test
  6. public void testTextSourceBatchOp() throws Exception {
  7. String URL = "https://alink-test-data.oss-cn-hangzhou.aliyuncs.com/iris.csv";
  8. BatchOperator <?> data = new TextSourceBatchOp().setFilePath(URL).setTextCol("text");
  9. data.print();
  10. }
  11. }

运行结果

| text | | —- |

| 6.5,2.8,4.6,1.5,Iris-versicolor |

| 6.1,3.0,4.9,1.8,Iris-virginica |

| 7.3,2.9,6.3,1.8,Iris-virginica |

| 5.7,2.8,4.5,1.3,Iris-versicolor |

| 6.4,2.8,5.6,2.1,Iris-virginica |

| 6.7,2.5,5.8,1.8,Iris-virginica |