Java 类名:com.alibaba.alink.operator.stream.source.RandomVectorSourceStreamOp
Python 类名:RandomVectorSourceStreamOp

功能介绍

生成随机张量的表

参数说明

| 名称 | 中文名称 | 描述 | 类型 | 是否必须? | 取值范围 | 默认值 | | —- | —- | —- | —- | —- | —- | —- |

| maxRows | 最大行数 | 输出数据流的行数目的最大值 | Long | ✓ | | |

| size | 张量size | 整型数组,张量的size | Integer[] | ✓ | | |

| sparsity | 稀疏度 | 非零元素在所有张量数据中的占比 | Double | ✓ | | |

| idCol | id 列名 | 列名,若列名非空,表示输出表中包含一个整形序列id列,否则无该列 | String | | | “alink_id” |

| outputCol | 输出列名 | 输出随机生成的数据存储列名 | String | | | “tensor” |

| timePerSample | 稀疏度 | 整型数组,张量的size | Double | | | null |

代码示例

Python 代码

  1. from pyalink.alink import *
  2. import pandas as pd
  3. useLocalEnv(1)
  4. RandomVectorSourceStreamOp().setMaxRows(5).setSize([2]).setSparsity(1.0).print()
  5. StreamOperator.execute()

Java 代码

  1. import com.alibaba.alink.operator.stream.StreamOperator;
  2. import com.alibaba.alink.operator.stream.source.RandomVectorSourceStreamOp;
  3. import org.junit.Test;
  4. public class RandomVectorSourceStreamOpTest {
  5. @Test
  6. public void testRandomVectorSourceStreamOp() throws Exception {
  7. new RandomVectorSourceStreamOp().setMaxRows(5L).setSize(new Integer[] {2}).setSparsity(1.0).print();
  8. StreamOperator.execute();
  9. }
  10. }

运行结果

| alink_id | tensor | | —- | —- |

| 5 | $2$0:0.4889045498516358 1:0.461837214623537 |

| 1 | $2$0:0.20771484130971707 |

| 3 | $2$0:0.06712000939049956 1:0.768156984078079 |

| 4 | $2$1:0.9186071189908658 |

| 2 | $2$0:0.49682259343089075 1:0.9858769332362016 |