concat_ws, collect_set

浏览 97 扫码分享 2023-11-24 02:19:49

concat_ws: 用指定的连接符连接字符串
collect_list: returns a list of objects with duplicates

https://spark.apache.org/docs/latest/api/python/pyspark.sql.html#pyspark.sql.DataFrame

concat_ws: 用指定的连接符连接字符串

concat_ws("_", field1, field2)
#out: field1_field2
concat_ws("_", [a, b, c])
# out: a_b_c

collect_list: returns a list of objects with duplicates

df = spark.createDataFrame([(2, ), (5, ), (7, ), ('age',)])

若有收获，就点个赞吧

上一篇:

下一篇:

让时间为你证明

展开/收起文章目录