天池大赛:不确定竞价 —— 赛题解读(1)
这篇文章不是教大家怎么建模,这篇文章就是我的工作日志的整理。这件事我怎么干的,我把它记录下
来,能够分享就分享一下。
鉴于上海财经大学和蚂蚁金服共同携手出版了大模型金融领域的应用,一时的 AIGC 又掀起了一波浪潮
,上次关注也是几年前。AI 从上世纪 80 年代开始,每隔几年就会掀起一波浪潮,我们不知什么时候会
真正颠覆,或许会非常无感。因此,本人认为,自己原来的工作,和新时代产生一种契合。这意味着,
自己原来工作做好非常重要,自己才能加入到新的军团中去创造感受前沿领域的工作。如若不然的话,
就是在自己行业里继续修炼,你加入新的社区也是要贡献的,专业程度不够,怎么贡献呢?对吧,其实
说穿了,就这么回事。
天池大赛关于 Bidding 比赛
初赛
复赛
以下是本人阅读的一些论文。
注意:论文解读只是个人理解,请谨慎使用。
这是本人工作时候留下的音频资料,一些知识点用讲的方式,把脑袋中最主要的思路获取出来。
针对讲课时候的意外发现,我都不太纠结,因为我和别人讨论问题的时候,也会有这种意外发现。和别
人争某个方案的时候,自己把自己说服了,这种情况蛮常见的,不用太纠结。
2024.9.7
1.赛题理解
推荐系统有很多,之前我学习过一个协同调整的。简言之,人和电影,形成一个矩阵,你根据不同维度
在不同维度聚合,形成边际分布,这时候你可以根据有 step 边际分布,去推荐电影。
天池大赛的不确定出价,针对人进行定价,简言之,一个客户出现了之后,对于平台而言就是出现了若
干个机会。这种思路解题目,具体我不展开,我自己阅读论文过程记录下来了,伙伴们自己找出合适的
信息。
伙伴们有疑问的话,可以给我们留言或者发邮件。留言效率低一些。
2.Cooperative Competitive Model
这个模型是兼顾合作和竞争的出价模式,认为第二个出价者,出的价格较低是合作,出的价格较高是竞
争。文章做了一些数据仿真,发现,相互竞争的 Social Welfare 是比较弱的,但是竞争者和平台都会
因此获得好处。而合作模型,可以使得社会效益更加好。这里社会效益的衡量,是所有竞争者的收入之
和。
注意:论文解读只是个人理解,请谨慎使用。
第一,关乎 Markov Game。
第二,关于 独立竞争者的双边竞争模型。
竞争其实对平台和竞争者都有好处,但是 Social Welfare 差。而合作是 Social Welfare 较大。
第三,混合模型。
Temperature Regularized Credit Assignment(TRCA),这个指标综合合作、竞争出价策略,用一种兼顾
两者的指标进行度量。
r_TRCA(i) = alpha(i) * r_tot
我们可以认为 TRCA 收益是用一种比例方式,拆出总收益中自己试图研究的部分。
第四,两个竞争者竞价的时候,核定了一个阈值,该阈值用以判断对方是合作还是竞争的。
第五,离线仿真。
主要对比 合作模型、竞争模型、混合模型,在不同场景下的贡献,表格数值是 Value 的意思。
第六,在线实验。
结论,文章贡献。(1)提出 TRCA,混合竞争与合作。(2)涉及 Bar Agent,防止过度合作。(3)提
出 Mean Agent,将类似商家聚合分析。
注意:论文解读只是个人理解,请谨慎使用。
第二篇论文解读
A Personalized Automated Bidding Frameworkfor Fairness-aware Online Advertising
2024.9.8
Pre 公务员是个非常能锻炼人的事情
Pre-2 超越限制
Pre-3 疫情期间,保持运动
论文解读
这篇文章后半部分还没看,应该是比较有价值的。
上述问题,可以采用拉格朗日乘子法,计算出来的结果,是多方程,少变量,采用数值方法,算出一个值。暂时我们提交的工作,还没有对这部分的答案进行优化。换言之,我们用拉格朗日乘子法计算,但是数值方法并不一定稳定。这里先做个记号。
这个算法暂时还没写过函数验证过,这里是可以开展工作的。
MAAB: Multi-Agent Auto-Bidding
这里是引入了 Bar Agent。这是之前的合作-竞争模型的延伸。
MEBS: Multi-task End-to-end Bids
这里只是朗读,加上一些理解。再一次提醒,我自己的工作用得不多,谨慎使用。放在网上,也会用作我自己学习工作。
知乎 KDD21 文章
这篇文章写得比较形象,但是呢,距离你作出模型还是差距挺大的。点击阅读原文《
[KDD21] A Unified Solution to Constrained Bidding in Online Display Advertising》。