
中小微企业贷款中,银行首先根据中小微企业的实力、信誉对其信贷风险做出评估,然后依据信贷风险等因素来确定是否放贷及贷款额度、利率和期限等信贷策略。
我们将问题分为三步:利用123家企业的信贷风险数据进行量化分析,接着根据信贷风险等因素指定信贷策略,最后研究疫情对决策的影响。数据来自网上开源的企业信贷数据。
数据1 记录了123家有信贷企业的企业信息、进销项发票数据。用于训练和验证。
数据2 记录了302家无信贷企业的企业信息、进销项发票数据,用于实际预测。
数据3 是贷款利率与客户流失率关系的统计数据。
经过仔细整理推敲,我们通过对原始数据的处理,选择了企业实力、上下游供求关系、企业发展潜力、企业抗风险能力四个方面20个特征。我们认为这些特征能很好地反映企业的信贷风险等级。
这是企业信誉等级和其中一些特征的关系图。可以看到,我们选取的这些特征和信誉等级有明显的相关性。
基于我们提取的这20个特征,我们使用了5中机器学习模型进行信誉评级预测。
我们使用sklearn库实现了五种好而不同的分类器的集成学习。集成方法采用软投票,基分类器的权重和其准确率成正比。可以看到,软投票取得了比基分类器更好的结果。
银行将综合的考虑收益和风险决定对各级企业的放贷额度和利率优惠,这将自然转化为多目标规划问题 。为了简化问题,我们假设只对信誉评级C以上的企业发放贷款,同信誉评级的企业风险一致。
然后分别计算收益目标和风险目标。收益目标是最大化—-,风险目标是最小化—-。
此外,我们还考虑了潜在损失目标流失:问题。根据数据3,使用线性回归得到各个企业客户流失率和利率的关系,从而计算各个信誉评级的企业在不同利率下的客户流失率。
根据现有的企业经营数据,提取疫情前后的特征信息。而疫情对不同行业的影响各异,我们同时利用股票信息衡量疫情对行业的影响。我们根据以上7个特征对企业进行聚类分析,对不同类别的企业划分不同的疫情风险乘数。
首先根据企业名称提取主要经营方向。
随后我们使用爬虫,结合搜索引擎高级指令,爬取bing上以企业经营方向、“疫情”作为关键词的新闻内容,通过新闻内容来判断疫情对行业的影响趋势。
我们初步方案是爬取百度网站,发现百度对爬虫做出了一定限制,在破解限制后,由于其对某些搜索结果存在大量广告,效果不佳,我们后改用必应进行搜索
接下来我们使用情感词典分析的方法,对分词并去除停用词之后的数据计算文本的情感得分,判断是中性文本、正面文本和负面文本。 然后得到了稳定系数和影响方向。稳定系数表示了—- 影响方向可以判断影响是有利还是阻碍行业的发展。
另外,我们从原始数据中选择了企业状况、利润、 、 、的方法。
通过经营方向将302家企业一共分为了13个行业,通过查询同花顺上的行业股票数据,得到他们股票指数2020年2个月的增长率, 用以衡量行业受疫情打击程度大小。
将上面计算的7 种特征, 作为系统聚类的依据。将数据代入SPSS, 进行系统聚类,根据聚合系数折线图确定聚类类别K=3。
这是我得到的每一类的统计信息。
过聚类得到三类企业,类别1的企业大部分为依然盈利或者收支平衡企业;类别2 的企业大部分为亏损;而类别3的企业只有4 个,且全部处于高风险状况。
针对此三类企业的状况,分别为其设置风险乘数:
Q1 = 1. 2 Q2 = 1. 5 Q3 = 2
最小化衡量疫情导致不稳定因素的目标稳
总结:
我们将信贷决策分为了3个步骤,
使用2020年1、2 月份的销项金额减去进项金额即可得到盈利情况,通过盈利情况计算 𝐶𝑜𝑛_𝑖
通过计算2020年1, 2 月份的企业利润π,与2019 年1, 2 月份的企业利润π,即可得到利润同比增长率
废票指的时公司所开的无效票据与负数票据之和,在一定程度上能够反应企业的销售情况
公司在受疫情影响的情况下, 与公司交易的企业数量的变动程度
我们查阅
