运用Logistic回归模型进行广告点击率预测

来源:互联网 发布:cocos2dx程序员工资 编辑:程序博客网 时间:2024/06/10 19:28

小生是一名在校学生,研究方向是IR,平日对ML、DM非常感兴趣,以下内容均是学习总结,才疏学浅,难免有错误之处,希望大家带着“批判”视角来看本文... 如能提出宝贵意见or建议,不胜感激~

正题:

        广告点击率估计对广告排序具有较大影响。 点击率估计是指在给定网页和用户的情况下,估计所投放的广告被点击次数占展示总次数的比例。

        广告点击率预测在CPC广告排序中是不可缺少的环节,根据一个user或者一个query,算出该将什么样的广告投放给user,以使得supply方利益最大化. 但是不能一味的从supply方的利益考虑,还要充分考虑demand方、user方的利益,为了更好的权衡这三方的关系,所以决定投放给特定user 的广告所用到的特征必须包括这三方的特征,主要特征:

1). Demand方:商品/广告信息,如文字描述、类目、价格、成交量等;卖家信息,信誉度、收藏数据量等(针对电商)

2). User方:历史搜索、点击、购买、收藏记录等

3). 其他信息:季节、节假日等  

(注:以上特征来自 一淘广告ML平台 蒋龙老师的ppt)

-----------------------------------------------------------------------------

        对于supply方来讲,就是要根据包含以上特征的历史数据,运用最优化方法(如梯度下降、似然估计等)求得参数theta(向量),跟对特定的user或者query,使用Logistic回归模型去算每一个广告的点击率CTR,

然后根据:RankSorce  = CTR * BidPrice;对广告进行排序, 选择最大的RankSorce对应的广告,投放给用户。

--------------------------------------------------------------------------------------------------------------------------------------

(以下是实现,由于暂时没有真实数据,只能用别的数据来'模拟'这样一个过程,思路和方法最重要)




小注: 按照点击量计费的广告计价模式是1997年Goto.com率先提出的,基于点击的广告计价有两种模型:统一费率模型和基于拍卖的模型。而上面所述的就是基于拍卖的模型。