RankNet

来源：互联网发布：迅游国际版 mac 编辑：程序博客网时间：2024/06/05 23:05

RankNet 论文的笔记。原文：
Learning to rank using gradient descent.

模型

若 f(xi)>f(xj) 则表示模型预测 i 排在 j 前面: xi▹xj。

后验概率 Pij=P(xi▹xj) 用如下形式：

P i j = 1 1 + e - o i j o i j \equiv o i - o j o i \equiv f (x i)

损失函数使用交叉熵的形式，并根据上面的定义变形为：

C i j \equiv C (o i j) = - P ¯ i j log P i j - (1 - P ¯ i j) log (1 - P i j) = - P ¯ i j o i j + log (1 + e o i j)

其中根据样本中两个 item 排序的在前、在后和同序关系，目标取值为：

P ¯ i j = {1, 0.5, 0}

论文中已经证明上述模型假设的一致性、传递性。由于 oik=oi−oj+(oj−ok)=oij+ojk，则容易得到：

P i j = P i j P j k 1 + 2 P i j P j k - P i j - P j k

oi 的取值使用神经网络模型

o i = g 3 ⎛ ⎝ ⎜ ⎜ \sum j w 32 j g 2 (\sum k w 21 j k x k + b 2 j) + b 3 i ⎞ ⎠ ⎟ ⎟ \equiv g 3 i

其中 g3,g2,w32,w21,b2,b3 分别为第三、第二层激活函数，第三、第二层的权重、第二、第三层偏置。

定义一个 pair 样本的损失为 l(o2−o1) (论文中用 f 表示，这里换成 l)，则参数的梯度 ∂αl=(∂αo2−∂αo1)l′。注意 ∂αo2=∂αf(x2)

\partial l \partial b 3 = l' (g' 3 (x 2) - g' 3 (x 1)) \equiv Δ 32 - Δ 31 \partial l \partial w 32 i = Δ 32 g 2 i (x 2) - Δ 31 g 2 i (x 1) \partial l \partial b 2 i = Δ 32 w 32 i g' 2 i (x 2) - Δ 31 w 32 i g' 2 i (x 1) \equiv Δ 2 2, i - Δ 2 1, i \partial l \partial w 21 i j = Δ 2 2, i x 2, j - Δ 2 1, i x 1, j

所有参数都可以根据上面的梯度，用梯度下降法来优化。

0 0