【财新网】当地时间2023年2月27日,法国巴黎,2022FIFA年度颁奖典礼举行。男足最佳11人名单公布,梅西、姆巴佩、本泽马、哈兰德四位锋线球员领衔,皇马球员共四人入选,C罗近16年首次落选。男足代表领奖。图:视觉中国
摘要
本篇主要工作,是实现变量选择方法中的 Filter 方法,针对基于 原始特征(即不选变量)、皮尔森相关系数 Pearson Correction、卡方检验 Chi2、最大信息系数 MIC、以及距离度量,四种度量下选择的特征集合,结合 13 个算法,考察不同算法针对不同特征子集的作用。
结论
点击《
天池大赛,天猫复购模型雏形初探》、《
天猫复购率:基础数据介绍》,获取更多信息。
针对天猫复购率数据集,获得以下结论:
1.RF最稳健;其次是 GB、XGB、ADA、ET;LGB显然对多变量集合更加友好。
2.原始集合在更多算法上效果占优,考虑资源的情况下,以 Pearson Correction为基准选出的变量集合,在更多算法上占优。
应用
本篇更多是对度量指标的验证和探索,助力读者更加透彻地理解工作中使用的指标。