推荐系统(九)

这篇主要讨论 aggregation of preference。这个名词看起来有点抽象,其实也没什么高级的,就是说怎么把一些 feature 聚合起来,嗯没错平均值就是一个最简单的例子。简单的说 aggregation function 将多个输入 merge 在一起产生一个输出。下面我们列举几个 RS 里面常见的例子:

  • CF 里 nearest-neighbor 方法使用 weighted sum 表示一个用户对某个 item 的 preference(根据 kNN 的 rating 进行加权)
  • content-based RS 常用各种 unigram/phrases/topic 的线性组合作为 ranking,也有通过 item 相似性做加权和。

从某种直观的意义上来说我们可以认为 aggregation function 是 [0,1]^n \mapsto [0, 1] 这样的函数,如果给定 f(\cdot) 的取值介于最大最小之间我们一般称为 averaging(如算术平均数,几何平均数,调和平均数等),不大于于最小值一般称为 conjunctive,不小于最大值称为 disjunctive,或者称为 mixed。另外为 aggregation function 我们多考虑下面的一些性质:

  • idempotent,f(t, \ldots, t) = t
  • 对称性,f(x, y) = f(y, x) 或者更广义的对任意置换 \sigma: f(t_1, \ldots, t_n) = f(t_{\sigma(1)}, \ldots, t_{\sigma(n)})
  • 结合律,f(f(a, b), c) = f(a, f(b, c))
  • shift-invariant,即 f(t_1 + \lambda, \ldots, t_n + \lambda) = f(t_1, \ldots, t_n) + \lambda
  • homogeneous,即 $latex f(\lambda t_1, \ldots, \lambda t_n) = \lambda f(t_1, \ldots, t_n)$
  • monotone/strictly monotone
  • Lipschitz continuous
  • neutral element,类似 group 里面的幺元,或者加法里面的 0
  • absorbing element,类似乘法里面的 0

通常应用问题决定需要的性质,性质决定选择的 aggregation function。是在没搞明白,这么简单的东西为啥值得写篇几十页的文章 -,- 难道是炫耀作者知道的函数多么?

——————
Then Sarah denied, saying, I laughed not; for she was afraid. And he said, No; but you did laugh.

Advertisements
推荐系统(九)

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 更改 )

Twitter picture

You are commenting using your Twitter account. Log Out / 更改 )

Facebook photo

You are commenting using your Facebook account. Log Out / 更改 )

Google+ photo

You are commenting using your Google+ account. Log Out / 更改 )

Connecting to %s