文本生成seq2seq框架

与原始的Encoder-Decoder模型相比,加入Attention机制后最大的区别就是原始的Encoder将所有输入信息都编码进一个固定长度的向量之中。而加入Attention后,Encoder将输入编码成一个向量的序列,在Decoder的时候,每一步都会选择性的从向量序列中挑选一个集合进行进一步处理。这样,在产生每一个输出的时候,都能够做到充分利用输入序列携带的信息。

发布博客 2022-04-13 02:28:15
1028 次阅读
Multi-gate Mixture-of-Experts(MMoE)

通过结合门控网络和混合专家组成的MMoE模型,从实验的结论上来看,能够利用同一个模型对多个任务同时建模,同时能够对多个任务之间的联系和区别建模。

发布博客 2022-04-07 12:32:31
1270 次阅读
Embeddings from Language Models(ELMo)

ELMo通过大量语料训练出与上下文无关的一系列向量表示,不同层级的向量带有不同的语言,包括了词法信息,句法信息以及语义信息,通过不同的组合,并在具体的上下文环境中微调得到带有上下文的词向量表示,并能够应用到具体的下游任务中。

发布博客 2022-04-05 17:55:25
1117 次阅读
Neural Factorization Machines(NFM)

Neural Factorization Machines(NFM)是在2017年提出的用于求解CTR问题的算法模型,在Wide & Deep模型被提出后,相继出现了一些改进的算法模型,如DeepFM和DCN可以看成是对于Wide & Deep模型中Wide部分的改进,而此处的NFM模型则是可以看作是对Deep部分的改进。

发布博客 2022-04-05 15:32:17
1083 次阅读
Deep Learning Recommendation Model(DLRM)

DLRM(Deep Learning Recommendation Model)是Facebook在2019年提出的用于处理CTR问题的算法模型,与传统的CTR模型并没有太大的差别,文章本身更注重的是工业界对于深度模型的落地,在文中介绍了很多深度学习在实际落地过程中的细节,包括如何高效训练。

发布博客 2022-04-03 23:35:07
1333 次阅读
DeepFM

在DeepFM网络中,通过将Wide & Deep模型中的Wide侧模型替换成FM模型,实现自动的交叉特征选择,从而实现无需人工参与就可以通过模型进行端到端的学习,自动学习到各种层级的交叉特征。

发布博客 2022-04-03 00:26:25
1048 次阅读
Deep&Cross Network(DCN)

Deep&Cross Network(DCN)是由Google于2017年提出的用于计算CTR问题的方法,是对Wide&Deep[2]模型的进一步改进。线性模型无法学习到特征的交叉属性,需要大量的人工特征工程的介入,深度网络对于交叉特征的学习有着天然的优势,在Wide&Deep模型中,Deep侧已经是一个DNN模型,而Wide侧是一个线性模型LR,无法有效的学习到交叉特征。

发布博客 2022-03-30 21:41:42
1255 次阅读
人脸识别系统FaceNet原理

Google在2015年提出了人脸识别系统FaceNet,可以直接将人脸图像映射到欧式空间中,空间中的距离直接代表了人脸的相似度。

发布博客 2022-03-29 09:56:46
1133 次阅读
Deep Crossing

Deep Crossing是微软在2016年提出的用于计算CTR问题的深度神经网络模型,Deep Crossing的网络结构对传统的FNN(Feedforward Neural Network)网络结构做了一些优化,使得其能够更适合处理CTR问题。

发布博客 2022-03-24 17:04:47
907 次阅读
PNN网络(Product-based Neural Network)

PNN(Product-based Neural Network)是在2016年提出的用于计算CTR问题的深度神经网络模型,PNN的网络结构对传统的FNN(Feedforward Neural Network)网络结构做了一些优化,使得其能够更适合处理CTR问题。

发布博客 2022-03-20 10:41:00
1508 次阅读
大数据Lambda架构详解

Lambda架构是由Nathan Marz在2011年提出的一个实时大数据处理框架,用于处理大数据批量离线处理和实时数据处理的需求。

发布博客 2022-03-11 17:00:38
1020 次阅读
java中数组和List的相互转换

在Java的线上业务开发中,各种数据结构之间的转换是必备的技能。Java中数组和List之间的相互转换是常见的数据结构之间的转换,更一般的说是对字符串切分,并将其转换成List,List和String数组的相互转换整理如下。

发布博客 2022-02-14 23:09:32
952 次阅读
Wide & Deep算法

Wide & Deep模型综合了Wide侧的记忆能力和Deep侧的泛化能力

发布博客 2021-10-30 22:50:38
1767 次阅读
神经网络语言模型

什么是语言模型?通俗的来讲是判断一句话是否符合人说话的模型,神经网络语言模型是在统计语言模型的基础上,通过神经网络模型对句子的概率分布建模的方法。

发布博客 2021-10-10 22:47:40
2061 次阅读