首页   >   新闻   >   文章

变量选择Filter方法实验:以天猫复购率为例
- 2023 -
03/06
01:31
零号员工
发表时间:2023.03.06     作者:Jingyi     来源:ShoelessCai     阅读:1872

【财新网】当地时间2023年2月27日,法国巴黎,2022FIFA年度颁奖典礼举行。男足最佳11人名单公布,梅西、姆巴佩、本泽马、哈兰德四位锋线球员领衔,皇马球员共四人入选,C罗近16年首次落选。男足代表领奖。图:视觉中国


摘要

本篇主要工作,是实现变量选择方法中的 Filter 方法,针对基于 原始特征(即不选变量)、皮尔森相关系数 Pearson Correction、卡方检验 Chi2、最大信息系数 MIC、以及距离度量,四种度量下选择的特征集合,结合 13 个算法,考察不同算法针对不同特征子集的作用。

结论

点击《天池大赛,天猫复购模型雏形初探》、《天猫复购率:基础数据介绍》,获取更多信息。

针对天猫复购率数据集,获得以下结论:

1.RF最稳健;其次是 GB、XGB、ADA、ET;LGB显然对多变量集合更加友好。

2.原始集合在更多算法上效果占优,考虑资源的情况下,以 Pearson Correction为基准选出的变量集合,在更多算法上占优。

应用

本篇更多是对度量指标的验证和探索,助力读者更加透彻地理解工作中使用的指标。





原文链接



长按/扫码,有您的支持,我们会更加努力!









TOP 5 精选

       



回到顶部   回上一级
写文章

最新资讯




直播笔记


热点话题


精品论文


有你的鼓励
ShoelessCai 将更努力





文档免费。保护知识产权,保护创新。