推荐系统–行为序列特征

行为序列01:用户历史行为序列建模

用户最近 n 次(top n)点击、点赞、收藏、转发等行为都是推荐系统中重要的特征,可以帮助召回和排序变得更精准。这节课介绍最简单的方法——对用户行为取简单的平均,作为特征输入召回、排序模型。

多目标排序模型:

这里 用户历史行为序列 就是指用户特征中的last n序列特征。

以用户点击过的last n的物品为例 ,对这n个物品id和其他特征用embedding做嵌入,获得相应的n个向量,对这n个向量取平均得到最终的向量。

这里对Last N个向量只是简单的做一下平均,也有更高级的做法,比如基于attention注意力。后面会提到 Last N 不同的序列建模方法。

行为序列02:DIN模型(注意力机制)

上节课介绍了用户的 LastN 序列特征。这节课介绍 DIN 模型,它是对 LastN 序列建模的一种方法,效果优于简单的平均。DIN 的本质是注意力机制(attention)。DIN 是阿里在 2018 年提出的,有兴趣的话可以阅读下面的参考文献。

什么是候选物体:对于精排模型来说,粗排模型输出的几百个物体就是候选物体。

行为序列03:SIM模型(长序列建模)

SIM 模型,它的主要目的是保留用户的长期兴趣。SIM 的原理是对用户行为序列做快速筛选,缩短序列长度,使得DIN可以用于长序列。

参考文献: Qi et al. Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Through Rate Prediction. In CIKM, 2020.

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注