序列深度匹配SDM

序列深度匹配(Sequential Deep Match,SDM)模型是在特定场景下提出的用于对用户动态兴趣偏好建模的算法。SDM模型应用于淘宝的场景中,在淘宝的场景中,用户的行为主要分为两种,第一个是当前的浏览Session,用户在一个Session中,需求往往是十分明确的。另一个是之前的历史行为,一个用户虽然可能不是每次都来买球鞋,但是也可能提供一定的有用信息。因此需要分别对这两种行为序列建模,从而刻画用户的兴趣。

发布博客 2020-10-16 17:52:21
2377 次阅读
基于Session的推荐

《Session-based recommendations with recurrent neural networks》首次提出将RNN方法应用于Session-based Recommendation。文章中提到当前主流的基于因子分解的模型或者基于邻域的模型很难对整个Session建模,得益于序列化建模算法的发展,使得基于Session的推荐模型成为可能,针对具体的任务,文章中设计了模型的训练以及ranking loss

发布博客 2020-10-16 13:14:55
1801 次阅读
Transformer对用户行为序列建模算法BST

Behavior Sequence Transformer(BST)算法是由阿里在2019年提出的算法,应用于淘宝推荐中的ranking阶段。在目前的推荐系统中,主流的深度学习方案,如WDL,并没有充分利用用户的行为序列(User's Behavior Sequence),在BST算法中,利用Transformer充分挖掘用户的行为序列,实现对用户行为序列的建模。

发布博客 2020-10-13 00:24:15
4071 次阅读
基于Graph Embedding的GES和EGES

GES和EGES是阿里在2018年提出的两个基于Graph Embedding的算法,其中GES全称为Graph Embedding with Side Information,EGES全称为Enhanced Graph Embedding with Side Information。为了解决冷启动的问题,GES和EGES在计算item embedding的过程中引入了side information。

发布博客 2020-09-30 01:13:48
3235 次阅读
长短期记忆网络LSTM

循环神经网络RNN存在长距离依赖的问题,长短期记忆(Long Short-Term Memory,LSTM)网络便是为了解决RNN中存在的梯度爆炸的问题而提出。在LSTM网络中,主要依靠引入“门”机制来控制信息的传播。

发布博客 2020-09-20 23:56:48
1908 次阅读
循环神经网络RNN

循环神经网络(Recurrent Neural Networks, RNN)主要用于处理时序数据,如文章,视频等

发布博客 2020-09-17 19:53:36
2068 次阅读
推荐系统——DeepWalk算法

DeepWalk算法是在KDD2014中提出的算法,最初应用在图表示(Graph Embedding)方向,由于在推荐系统中,用户的行为数据固然的可以表示成图的形式,因此DeepWalk算法也常被用于推荐系统中的item embedding的计算。

发布博客 2020-09-16 01:24:23
2600 次阅读
深度语义模型DSSM

深度语义模型(Deep Structured Sematic models, DSSM)是在2013年由微软的研究人员提出,主要解决的是在搜索的过程中,对于传统的依靠关键词匹配的方法的弊端(语义上的相似)提出的潜在语义模型。DSSM算法在实际工作中也被证明是卓有成效的算法,不仅在搜索中得到广泛的应用,同时也被使用在推荐系统的召回中。

发布博客 2020-09-15 23:49:06
1979 次阅读
目标检测——R-CNN

RCNN(Region with CNN features)算法发表在2014年CVPR的经典paper:《Rich feature hierarchies for Accurate Object Detection and Segmentation》中,这篇文章是目标检测领域的里程碑式的论文,首次提出使用卷积神经网络(Convolutional Neural Networks, CNNs)处理目标检测(Object Detetion)的问题。

发布博客 2020-08-12 16:14:36
1729 次阅读
Attention-Based BiLSTM

Attention-Based BiLSTM结合双向的LSTM(Bidirectional LSTM)以及Attention机制处理文本分类的相关问题,通过attention机制,该方法可以聚焦到最重要的词,从而捕获到句子中最重要的语义信息。

发布博客 2020-08-10 15:49:51
1650 次阅读
word2vec源码解析

详细介绍word2vec的原理以及计算过程,涉及word2vec中的基本概念,如CBOW模型和Skip-gram模型的网络结构,Hierarchical Softmax和Negative Sampling的基本概念以及训练方法,Hierarchical Softmax与Huffman树的关系

发布博客 2020-07-05 03:45:47
1943 次阅读