首页   >   新闻   >   文章

基于Satterthwaite目标的协同训练应用于欧洲银行用户分析
- 2020 -
05/01
00:00
零号员工
发表时间:2020.05.01     作者:Jingyi Li     来源:ShoelessCai     阅读:1353

摘要

半监督模型适用于标记有限但样本量较大的情况,旨在用算法补数据。本篇获取某欧洲银行用户数据,其1/3的目标缺失,故选择半监督模型进行协同训练,以找出适合数据的泛化能力较好的模型,考察能为银行创收的用户的特点。

Satterthwaite统计量用于变换若干个服从卡方分布的变量,以使得符合特征集合的价值信息的线性部分,可以更精确地被提取。本篇从用户在银行产生的收入之和的抽样分布入手,以卡方分布拟合,并建立基于Satterthwaite目标的协同训练模型,考察用户在银行创收产品离散程度的情况。

结论

综合上述建模与分析的过程,本篇做出如下结论:

第一,特征工程对于逻辑回归的性能提升作用有限,偶尔还会使区分力下降;但特征工程能显著提升决策树模型的性能,特别是XGBoost,其区分力指标提升了5%。第二,协同训练模型能够提升区分能力(包括整体和单一模型),整体性能更加依赖XGBoost,而逻辑回归区分力提升时,对整个协同训练模型区分力的贡献度有限。第三,逻辑回归和XGBoost所在视图的变量维度的“距离”越远,算法效果越好,符合Blum于1998年做出的结论:视图描述目标的角度越是正交,越能够提升该模型综合输出的区分力。第四,参数调整能够提升的空间比较有限,但合适的参数仍有帮助。第五,Satterthwaite目标的协同训练,在高分段出现低价值用户和低分段出现高价值用户,均为潜在用户。

应用

Satterthwaite目标下的协同训练模型,考察的是用户在银行创收的金融产品丰富程度,目标用户拥有两个及以上金融产品并创收。

一方面,该模型得分中高及以上客户的人均创收呈下降趋势,主要由于部分用户虽然创收产品的种类多,例如同时拥有信用卡和消费贷,但他们创收的金额实则不高。零现金用户就是很好的例子,其资产有限,增值速度较慢,偏好消费,虽然能为银行创收,但金额有限。另一方面,对于评分较低的用户,也存在一定比例的用户价值较高,例如共同基金用户,这类用户偏好投资,对于储蓄、消费贷、信用卡的使用率很低,他们对银行的价值很高,但会由于所持金融产品单一而被划入低分段。



原文链接



长按/扫码,有您的支持,我们会更加努力!









TOP 5 精选

       



回到顶部   回上一级
写文章

最新资讯




直播笔记


热点话题


精品论文


有你的鼓励
ShoelessCai 将更努力





文档免费。保护知识产权,保护创新。