推荐系统入门

推荐系统一般分为2个部分，召回、粗排、精排、重排。本文是对推荐系统的一个入门学习。

对比推荐和NLP，我认为NLP更像是偏底层的技术， 推荐系统的问题抽象之后和NLP问题非常相似。

推荐系统的基本问题可以抽象成求解

$p(item_i|user, history\_item_1, history\_item_2, ... history\_item_k)$

即求解指定 item在指定user的历史行为记录下可能产生行为的联合条件概率，其中item, history_item的形式都是item id。

而NLP的language model中，第k个word的概率也正是类似的形式。

$p(w_i|w_{i-1}, w_{i-2}, ... w_1)$

工业界推荐系统一般包含四个部分：召回、粗排、精排、重排（召回和排序）。下面分别了解一下。

召回阶段负责从海量数据中快速筛选出部分数据，供后面排序阶段使用。