【学习笔记】推荐系统 (7.特征交叉：FM、DCN、LHUC、SENet、Bilinear Cross、FiBiNet)

xhyu612026-02-26 8:48

网课：王树森 - 推荐系统公开课

7.1 Factorized Machine (FM)

7.1.1 线性模型

有 d d d个特征，记作 x = $x 1 , \dots , x d$ x= $x_1,\\cdots,x_d$ x= $x1,\dots,xd$ ；
线性模型： p = b + ∑ i = 1 d w i x i p=b+\sum_{i=1}^d w_ix_i p=b+∑i=1dwixi；
模型有 d + 1 d+1 d+1个参数；
预测是特征的加权和（特征之间没有交叉）。

7.1.2 二阶交叉特征

有 d d d个特征，记作 x = $x 1 , \dots , x d$ x= $x_1,\\cdots,x_d$ x= $x1,\dots,xd$ ；
线性模型+二阶交叉特征： p = b + ∑ i = 1 d w i x i + ∑ i = 1 d ∑ j = i + 1 d u i j x i x j p=b+\sum_{i=1}^d w_ix_i+\sum_{i=1}^d\sum_{j=i+1}^d u_{ij}x_ix_j p=b+∑i=1dwixi+∑i=1d∑j=i+1duijxixj；
模型有 O ( d 2 ) O(d^2) O(d2)个参数， d d d很大时，计算代价很大，容易出现过拟合。

用矩阵 V V V近似矩阵 U U U： U = V V ⊤ U=VV^\top U=VV⊤，于是 u i j = v i ⊤ v j u_{ij}=v_i^\top v_j uij=vi⊤vj。
于是得到Factorized Machine (FM)：
p = b + ∑ i = 1 d w i x i + ∑ i = 1 d ∑ j = i + 1 d ( v i ⊤ v j ) x i x j p=b+\sum_{i=1}^d w_ix_i+\sum_{i=1}^d\sum_{j=i+1}^d (v_i^\top v_j)x_ix_j p=b+i=1∑dwixi+i=1∑dj=i+1∑d(vi⊤vj)xixj
FM中有 O ( k d ) O(kd) O(kd)个参数，k远小于d。

7.1.3 FM

FM是线性模型的替代品，能用线性回归、逻辑回归的场景，都可以用FM；
FM使用二阶交叉特征，表达能力比线性模型更强；
通过做近似 u i j = v i ⊤ v j u_{ij}=v_i^\top v_j uij=vi⊤vj，FM把二阶交叉权重的数量从 O ( d 2 ) O(d^2) O(d2)降低到 O ( k d ) O(kd) O(kd)。

7.2 深度交叉网络 (DCN)

7.2.1 交叉层(Cross Layer)

交叉层可写作：
x i + 1 = x 0 ∘ ( W ⋅ x i + b ) + x i x_{i+1}=x_0\circ(W\cdot x_i+b)+x_i xi+1=x0∘(W⋅xi+b)+xi

7.2.2 交叉网络 (Cross Network)

7.2.3 深度交叉网络 (Deep & Cross Network)

7.3 LHUC

图中神经网络包含很多全连接层，最后一个全连接层的输出是Sigmoid×2。

7.4 SENet

推荐系统会将上图中左边的属性通过Embedding嵌入成向量，用于后续排序。

SENet结构如下：

注：Embedding向量维度可以不同：

SENet的本质是对离散特征做field-wise加权，如果有 m m m个field（这里就是输入的离散特征数量），那么权重向量是 m m m维。

7.5 Bilinear Cross

7.5.1 特征交叉方法

由上图可知，哈达玛乘积产生 m 2 m^2 m2个向量，计算开销不被接受。

7.5.2 Bilinear Cross (内积形式)

其中 x i x_i xi和 x j x_j xj的形状可以不同。

如果有 m m m个fields，则 f f f有 m 2 m^2 m2个元素，有 m 2 / 2 m^2/2 m2/2个 W W W。

7.5.2 Bilinear Cross (哈达玛形式)

如果有 m m m个fields，则得到 m 2 m^2 m2个向量。

如果使用哈达玛形式的Bilinear Cross，则推荐选择一些field来做交叉，而不是全部fields。

7.6 FiBiNet

上一篇：OpenClaw Docker容器升级实战：从v2026.2.22-2到v2026.2.24的安全配置变更与故障排除

下一篇：什么是循证营养？循证营养：重构健康产业信任的科学路径

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03如何新建文件夹？电脑新建文件夹的4种方法 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 06幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 09【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……102026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？