项目背景

美国运通-违约预测 预测客户将来是否会违约

竞赛地址:https://www.kaggle.com/competitions/amex-default-prediction/overview
二分类预测比赛
竞赛评价指标
The evaluation metric, kaggle竞赛立项American Express - Default Prediction - 图1M, for this competition is the mean of two measures of rank ordering: Normalized Gini Coefficient, kaggle竞赛立项American Express - Default Prediction - 图2G, and default rate captured at 4%, kaggle竞赛立项American Express - Default Prediction - 图3D.

本次比赛的评估指标M 是两个排名指标的平均值:归一化基尼系数G,以及4%的违约率D 。
M=0.5⋅(G+D)
4%捕获的默认率是在最高排名的4%预测中捕获的阳性标签(默认值)的百分比,表示敏感度/召回统计。对于子指标G和D,负标签的权重为20,以调整下采样。此度量的最大值为1.0。
计算此度量的Python代码可以在本笔记本中找到。链接

Submission File

For each customer_ID in the test set, you must predict a probability for the target variable. The file should contain a header and have the following format:
对于测试集中的每个customer\u ID,必须预测目标变量的概率。文件应包含标题,并具有以下格式:

  1. customer_ID,prediction
  2. 00000469ba...,0.01
  3. 00001bf2e7...,0.22
  4. 0000210045...,0.98
  5. etc.

项目目标

描述本项目期望达成的目标,目标需满足Smart原则:

  1. 拿奖牌
  2. kaggle提交次数
  3. 学到的新知识点输出
  4. 文档编写量
目标 具体描述 截止日期
发现比赛 开始立项 2022-05-31
确立 该目标的具体描述… 2022-xx-xx
报名比赛班-398 2022-06-20

关键事项

为达成上述目标,需要完成哪些关键事项。(容易到难)

  • 至少在后续的75天时间里,围绕该竞赛的文档更新不少于30天(次)。【包含金牌文档翻译整理、模型实践记录、特征工程笔记】 【1/30】
  • 若有该比赛班,报名参加 ,并全程参与直播【0/N】
  • 在社群内讨论,提问【0/1】
  • 2022.06.20购买比赛课程,看到公司内的一些面评,感觉掌握基础,能自如面试,还是很重要的,否则一块kaggle银牌,在面试官的评价里就是:“仅有kaggle基础”而已。

    里程碑

    2022年5月25日-开始日期。 2022年8月17日-报名截止日期。您必须在此日期之前接受竞赛规则才能参加比赛。 2022年8月17日-团队合并截止日期。这是参与者加入或合并团队的最后一天。 2022年8月24日-最终提交截止日期。 除非另有说明,否则所有截止日期均为相应日期UTC下午11:59。如有必要,竞赛组织者保留更新竞赛时间表的权利。

kaggle竞赛立项American Express - Default Prediction - 图4

风险提示

对项目结题、法务风险问题进行提示,并说明应对措施。

风险描述 应对措施 责任
涉及用户个人信息,需要进行隐私保护方面考虑 完善隐私政策 xxx