【点击模型学习笔记】Inferring clickthrough rates on ads from click behavior on search results_wsdm2011

来源:互联网 发布:沪昆高铁质量 知乎 编辑:程序博客网 时间:2024/05/28 23:08
概要:
看这篇文章的初衷,是这篇文章回答了问题“在一个query的结果当中,给出多少个广告位合适?”。文章不长,不过一路看下来,发现貌似不是native-english-speaker写的,细节说的不清楚,完全无法还原作者的工作思路。不过还是有那么一点儿收获的。

具体内容:

搜索主要的赚钱方式是在搜索结果当中嵌入广告,一般来讲是按照广告的点击次数来付费的。这样,就有一个趋势,如果想要赚钱多,就在搜索结果中越来越多的植入广告,使得广告的点击次数越来越多,则赚的钱就越来越多;不过,也有研究表明,如果植入的广告越多,则搜索结果的质量下降,用户对搜索结果的整体点击率也会下降,则用户对广告的点击也会下降。本文的目标就是找到一种“平衡点”,在不影响搜索质量的前提下,广告的点击率最大。
本文的优化目标就是广告的点击率。

作者看数据,发现如果搜索结果的top结果点击率比较低,则放几个广告上去是比较适合的。从实际情景上来看,用户的搜索目的并不十分明确,则比较容易点击广告。进一步的(个人想法),如何判断这种情况?对于每个query,用户的点击分布,计算熵,如果熵值比较大,则点击比较‘均匀’,则适合广告投放。

query,根据广告主是否买了这个query中的term,和query返回的结果当中是否有广告数据,分为commercial query和non-commercial query。

在实验数据上,作者证实了搜索结果点击和广告点击的相关性。证实的方法,貌似是对搜索结果进行区域划分,每个区域作为一个bin,计算bin上面的熵。搜索结果上面的计算结果和广告上的计算结果的大小增长趋势是一致的,就认为是相关的了。

如何确定搜索结果里面投放的广告个数?
作者对这个问题做了简化,两种选择:或者投放一个广告,或者投放三个广告。总体要优化的是用户总点击次数。对这两种情况进行加权。用LR等模型进行学习。——说实话,没看懂作者的加权后的目标函数。
作者似乎也不是针对每个query,来确定到底实现是一个广告还是三个广告,貌似统一的做一个权重,如:对所有query,显示1.5个广告?
文章写的很不清晰。

0 0