项目背景
美国运通-违约预测 预测客户将来是否会违约
竞赛地址:https://www.kaggle.com/competitions/amex-default-prediction/overview
二分类预测比赛
竞赛评价指标
The evaluation metric, M, for this competition is the mean of two measures of rank ordering: Normalized Gini Coefficient, G, and default rate captured at 4%, D.
本次比赛的评估指标M 是两个排名指标的平均值:归一化基尼系数G,以及4%的违约率D 。
M=0.5⋅(G+D)
4%捕获的默认率是在最高排名的4%预测中捕获的阳性标签(默认值)的百分比,表示敏感度/召回统计。对于子指标G和D,负标签的权重为20,以调整下采样。此度量的最大值为1.0。
计算此度量的Python代码可以在本笔记本中找到。链接
Submission File
For each customer_ID in the test set, you must predict a probability for the target variable. The file should contain a header and have the following format:
对于测试集中的每个customer\u ID,必须预测目标变量的概率。文件应包含标题,并具有以下格式:
customer_ID,prediction
00000469ba...,0.01
00001bf2e7...,0.22
0000210045...,0.98
etc.
项目目标
描述本项目期望达成的目标,目标需满足Smart原则:
- 拿奖牌
- kaggle提交次数
- 学到的新知识点输出
- 文档编写量
目标 | 具体描述 | 截止日期 |
---|---|---|
发现比赛 | 开始立项 | 2022-05-31 |
确立 | 该目标的具体描述… | 2022-xx-xx |
报名比赛班-398 | 2022-06-20 |
关键事项
为达成上述目标,需要完成哪些关键事项。(容易到难)
- 至少在后续的75天时间里,围绕该竞赛的文档更新不少于30天(次)。【包含金牌文档翻译整理、模型实践记录、特征工程笔记】 【1/30】
- 若有该比赛班,报名参加 ,并全程参与直播【0/N】
- 在社群内讨论,提问【0/1】
- 2022.06.20购买比赛课程,看到公司内的一些面评,感觉掌握基础,能自如面试,还是很重要的,否则一块kaggle银牌,在面试官的评价里就是:“仅有kaggle基础”而已。
里程碑
2022年5月25日-开始日期。 2022年8月17日-报名截止日期。您必须在此日期之前接受竞赛规则才能参加比赛。 2022年8月17日-团队合并截止日期。这是参与者加入或合并团队的最后一天。 2022年8月24日-最终提交截止日期。 除非另有说明,否则所有截止日期均为相应日期UTC下午11:59。如有必要,竞赛组织者保留更新竞赛时间表的权利。
风险提示
对项目结题、法务风险问题进行提示,并说明应对措施。
风险描述 | 应对措施 | 责任 |
---|---|---|
涉及用户个人信息,需要进行隐私保护方面考虑 | 完善隐私政策 | xxx |
… | … | … |