Java 类名:com.alibaba.alink.operator.stream.source.TextSourceStreamOp
Python 类名:TextSourceStreamOp

功能介绍

按行读取文本文件的数据。

参数说明

| 名称 | 中文名称 | 描述 | 类型 | 是否必须? | 取值范围 | 默认值 | | —- | —- | —- | —- | —- | —- | —- |

| filePath | 文件路径 | 文件路径 | String | ✓ | | |

| ignoreFirstLine | 是否忽略第一行数据 | 是否忽略第一行数据 | Boolean | | | false |

| textCol | 文本列名称 | 文本列名称 | String | | | “text” |

代码示例

Python 代码

  1. from pyalink.alink import *
  2. import pandas as pd
  3. useLocalEnv(1)
  4. URL = "https://alink-test-data.oss-cn-hangzhou.aliyuncs.com/iris.csv"
  5. data = TextSourceStreamOp().setFilePath(URL).setTextCol("text")
  6. data.print()
  7. StreamOperator.execute()

Java 代码

  1. import com.alibaba.alink.operator.stream.StreamOperator;
  2. import com.alibaba.alink.operator.stream.source.TextSourceStreamOp;
  3. import org.junit.Test;
  4. public class TextSourceStreamOpTest {
  5. @Test
  6. public void testTextSourceStreamOp() throws Exception {
  7. String URL = "https://alink-test-data.oss-cn-hangzhou.aliyuncs.com/iris.csv";
  8. StreamOperator <?> data = new TextSourceStreamOp().setFilePath(URL).setTextCol("text");
  9. data.print();
  10. StreamOperator.execute();
  11. }
  12. }

运行结果

| text | | —- |

| 5.0,3.2,1.2,0.2,Iris-setosa |

| 6.6,3.0,4.4,1.4,Iris-versicolor |

| 5.4,3.9,1.3,0.4,Iris-setosa |

| 5.0,2.3,3.3,1.0,Iris-versicolor |