Multi-gate Mixture-of-Experts(MMoE)

通过结合门控网络和混合专家组成的MMoE模型,从实验的结论上来看,能够利用同一个模型对多个任务同时建模,同时能够对多个任务之间的联系和区别建模。

2022-04-07 20:32 搜索·推荐·广告 3940 阅读

Embeddings from Language Models(ELMo)

ELMo通过大量语料训练出与上下文无关的一系列向量表示,不同层级的向量带有不同的语言,包括了词法信息,句法信息以及语义信息,通过不同的组合,并在具体的上下文环境中微调得到带有上下文的词向量表示,并能够应用到具体的下游任务中。

2022-04-06 01:55 NLP 2646 阅读

Neural Factorization Machines(NFM)

Neural Factorization Machines(NFM)是在2017年提出的用于求解CTR问题的算法模型,在Wide & Deep模型被提出后,相继出现了一些改进的算法模型,如DeepFM和DCN可以看成是对于Wide & Deep模型中Wide部分的改进,而此处的NFM模型则是可以看作是对Deep部分的改进。

2022-04-05 23:32 搜索·推荐·广告 2645 阅读

Deep Learning Recommendation Model(DLRM)

DLRM(Deep Learning Recommendation Model)是Facebook在2019年提出的用于处理CTR问题的算法模型,与传统的CTR模型并没有太大的差别,文章本身更注重的是工业界对于深度模型的落地,在文中介绍了很多深度学习在实际落地过程中的细节,包括如何高效训练。

2022-04-04 07:35 搜索·推荐·广告 3681 阅读

DeepFM

在DeepFM网络中,通过将Wide & Deep模型中的Wide侧模型替换成FM模型,实现自动的交叉特征选择,从而实现无需人工参与就可以通过模型进行端到端的学习,自动学习到各种层级的交叉特征。

2022-04-03 08:26 搜索·推荐·广告 2583 阅读

Deep&Cross Network(DCN)

Deep&Cross Network(DCN)是由Google于2017年提出的用于计算CTR问题的方法,是对Wide&Deep[2]模型的进一步改进。线性模型无法学习到特征的交叉属性,需要大量的人工特征工程的介入,深度网络对于交叉特征的学习有着天然的优势,在Wide&Deep模型中,Deep侧已经是一个DNN模型,而Wide侧是一个线性模型LR,无法有效的学习到交叉特征。

2022-03-31 05:41 搜索·推荐·广告 3928 阅读

人脸识别系统FaceNet原理

Google在2015年提出了人脸识别系统FaceNet,可以直接将人脸图像映射到欧式空间中,空间中的距离直接代表了人脸的相似度。

2022-03-29 17:56 CV 3182 阅读

Deep Crossing

Deep Crossing是微软在2016年提出的用于计算CTR问题的深度神经网络模型,Deep Crossing的网络结构对传统的FNN(Feedforward Neural Network)网络结构做了一些优化,使得其能够更适合处理CTR问题。

2022-03-25 01:04 搜索·推荐·广告 2265 阅读

PNN网络(Product-based Neural Network)

PNN(Product-based Neural Network)是在2016年提出的用于计算CTR问题的深度神经网络模型,PNN的网络结构对传统的FNN(Feedforward Neural Network)网络结构做了一些优化,使得其能够更适合处理CTR问题。

2022-03-20 18:41 搜索·推荐·广告 3695 阅读

大数据Lambda架构详解

Lambda架构是由Nathan Marz在2011年提出的一个实时大数据处理框架,用于处理大数据批量离线处理和实时数据处理的需求。

2022-03-12 01:00 架构设计 2610 阅读

java中数组和List的相互转换

在Java的线上业务开发中,各种数据结构之间的转换是必备的技能。Java中数组和List之间的相互转换是常见的数据结构之间的转换,更一般的说是对字符串切分,并将其转换成List,List和String数组的相互转换整理如下。

2022-02-15 07:09 Java 2414 阅读

LeetCode-1. 两数之和

LeetCode-两数之和

2022-02-03 02:16 LeetCode 2423 阅读

Wide & Deep算法

Wide & Deep模型综合了Wide侧的记忆能力和Deep侧的泛化能力

2021-10-31 06:50 搜索·推荐·广告 5443 阅读

神经网络语言模型

什么是语言模型?通俗的来讲是判断一句话是否符合人说话的模型,神经网络语言模型是在统计语言模型的基础上,通过神经网络模型对句子的概率分布建模的方法。

2021-10-11 06:47 NLP 4816 阅读

C/C++中的变长结构体

这种最后一个成员的长度不固定的写法称为柔性数组,也叫伸缩性数组,即变长数组。

2021-06-16 08:04 C/C++ 3306 阅读