萧箫 整理自 KDD 2021量子位 报道 | 公众号 QbitAI这年头|用上GAN的推荐算法成精了,看完视频马上刷出相关文章丨KDD 2021( 二 )


团队在Netflix和微信多领域推荐数据集上进行了测试后 , 发现模型在离线和在线实验的多个结果上都获得了显著的提升 , 论文也进行了充分的消融实验和模型分析 , 以验证模型各个模块的有效性 。
萧箫 整理自 KDD 2021量子位 报道 | 公众号 QbitAI这年头|用上GAN的推荐算法成精了,看完视频马上刷出相关文章丨KDD 2021
文章图片
△图1:多领域推荐及AFT模型框架图
具体来说 , 如上图1 , AFT包括domain-specificmaskedencoder以及two-stepfeaturetranslation , 着重关注跨领域、多粒度的特征交互建模 。
在生成器(generator)部分 , 论文先设计了一个domain-specificmaskedencoder , 通过mask掉目标领域的历史行为特征(historicalbehaviors) , 来加强“其它领域历史行为特征”和“目标领域点击行为”之间的交互特征权重 , 以驱使AFT模型学习基于其它领域特征进行的目标领域推荐;
再用Transformer层和Domain-specificaggregation来抽取目标领域相关的用户特征 , 以生成top-k虚假点击的物品(fakeclickeditems) 。 这些虚假点击的物品将被输入判别器 , 迷惑判别器的判断 , 在对抗中相互提升所有领域的推荐能力 。
在判别器(discriminator)部分 , 论文受知识表示学习模型(KRL)启发 , 希望显式地对用户、物品和领域进行建模 。
其中 , 先用Transformer从多领域特征中分别抽取用户的细粒度item和粗粒度domain的偏好特征 , 分别标记为useritem-levelpreference和userdomain-levelpreference;
再构造第一个三元组(useritem-levelpreference , userdomain-levelpreference , usergeneralpreference) , 进行第一次特征转移 , 学习用户通用领域的偏好特征(usergeneralpreference) 。 第一个三元组的物理含义是 , 对于(Hamlet , writer , Shakespeare)三元组关系 , 有Hamlet+writer=Shakespeare(以KRL中的经典模型TransE为例) 。
在多领域推荐中 , 用户不同粒度的偏好相加(item-levelpreference+domain-levelpreference) , 就约等于用户通用领域的偏好(usergeneralpreference) , 因此这一步能得到用户通用领域的偏好 。
然后 , 论文再次构建第二个三元组(usergeneralpreference,targetdomaininformation,userdomain-specificpreference) , 进行第二次特征转移 。 第二个三元组的物理含义是 , 用户的通用领域偏好+目标领域的特征=用户在目标领域的偏好(userdomain-specificpreference) 。
论文基于成熟的知识表示学习模型ConvE进行两层特征转移(two-stepfeaturetranslation)后 , 得到了用户在目标领域上的表示 , 并用于推荐 。
那么 , AFT模型到底有什么优势?
其一 , AFT的GAN框架在domain-specificmaskedencoder的帮助下 , 提供了充足且高质量的多领域推荐负例 , 缓解了数据稀疏和过拟合的问题;
其二 , 生成器中的domain-specificmaskedencoder能加强模型的跨领域特征交互 , 而这正是多领域推荐的核心要素;
其三 , 判别器中的two-stepfeaturetranslation提供了一种大胆的、显式化可解释的建模用户、物品和领域的方式 , 对多领域推荐提供了更深层次的理解 。
团队将AFT模型和多个有竞争力的baseline模型进行了离线和线上对比 。 结果显示 , AFT模型在多个领域上全面显著地超出所有baseline 。 此外 , 团队还进行了详尽的消融实验和模型分析实验 , 用以加深对AFT各个模块和参数的理解 。
目前 , AFT模型已经在用了——被部署于微信看一看的多领域推荐场景 , 正服务于千万用户 。 论文本身的贡献如下:针对多领域推荐问题 , 提出了一个全新的AFT框架 , 首次在多领域推荐中引入了对抗下的特征转移 。 提出了一种GAN框架下的domain-specificmaskedencoder , 能够针对跨领域特征交互进行特化加强 。 设计了一种两阶段特征转移策略 , 尝试使用结构化知识表示学习的建模方式 , 学习用户多粒度多领域偏好、物品和领域之间的可解释的转移关系 。 AFT在离线和线上实验中均取得显著的提升效果 , 并已经被部署于微信看一看系统 。