重命令列

originDS.withColumnRenamed("old","new")

增加一列常量

  1. import org.apache.spark.sql.functions._
  2. info_lg.withColumn("type",lit("Hotel"))

填充指定列的Null值

  1. //列YYCSMC基本都是Null,所以使用fill填充默认值
  2. info_wb
  3. .na.fill("未知网吧名",cols = Array("YYCSMC"))
  4. .na.fill("未知网吧地址",cols = Array("DZ"))