数据预处理 - 新建列 - 《数据分析》

有时候我们要根据已有的特征新建一些特征

data['应付金额'] = data.apply(lambda x: x['全区基准点数']*67.1893-x['个人现金支付(元)'] if x['参保类型']=='职工基本医保' else x['全区基准点数']*64.0111-x['个人现金支付(元)'],axis=1)

提取字段的部分新建列，类似SQL的substring

df['MDC'] = df['分组编码'].str[0]