重命令列
originDS.withColumnRenamed("old","new")
增加一列常量
import org.apache.spark.sql.functions._
info_lg.withColumn("type",lit("Hotel"))
填充指定列的Null值
//列YYCSMC基本都是Null,所以使用fill填充默认值
info_wb
.na.fill("未知网吧名",cols = Array("YYCSMC"))
.na.fill("未知网吧地址",cols = Array("DZ"))