摘要
本篇基于FICO评分卡,找出用户在完成预定动作之后,订单成功率最高的头部流量客户,以便于公司跟进,提升用户体验,促进房东出租房源。本篇选取Python作为主要软件,在算法和模型的选择上,先选取合适的算法包,再选取合适的变量,最后再次进行回归。变量选择的方式用的是逻辑回归中的逐步回归原则,入模变量均用WOE的方式离散化。
结论
第一,交互信息是订单成功的关键。结果显示,最重要的变量均出自于交互信息类别,分别为交互频次、聊天时长和房东回复速度,这三个变量很大程度上决定了用户订单成功率评,三个变量总共贡献了评分卡67%的分数。第二,模型AUC值0.97,KS达到81%,PSI为0.03。首先,python statsmodels算法呈现极其微弱的过拟合趋势,对输入数据的要求严格,要求特征矩阵严格非奇异。其次,本篇选择了机器学习sklearn的逻辑回归算法建模,指标区分度佳,AUC达到0.97,KS值81%,人群稳定性指标PSI为0.03。第三,评分最高的20%头部流量中,99%的订单会成功。
应用
基于结论3:评分最高的20%头部流量中,99%的订单会成功。从应用角度来说,若用户成立订单之后,评分在进入前20%,则有99%的概率订单可以促成。另外,评分中值可以召回97%的成功订单,若对中值以上用户推送活动,可以覆盖97%潜在成功订单。