Meta | HSTU:生成式推荐工业级方案

  1. torch.nn.Embedding
    把词的数字编号,转换成神经网络能处理的向量(查表映射)
python 复制代码
import torch
from torch import nn
# 词典大小10个词(0~9),每个词转成4维向量
emb = nn.Embedding(10, 4)
# 输入:词编号,两句话,每句话三个词
idx = torch.LongTensor([[1,2,3], [4,5,0]])
# 输出:词向量
out = emb(idx)#将idx的两个句子按照词-向量表一一转换
# out.shape = [2,3,4]
# 也可以得出输入语料必须padding对齐处理
  1. torch.nn.Linear 全连接层
    对输入特征做线性变换 ------ 降维、升维、特征融合
    Yn×o=Xn×iWi×o+bY_{n×o} =X_{n×i} W_{i×o} +bYn×o=Xn×iWi×o+b
python 复制代码
torch.nn.Linear(in_features, # 输入的神经元个数
           out_features, # 输出神经元个数
           bias=True # 是否包含偏置
           )
相关推荐
Ralph_Salar7 分钟前
从0到1搭建AI智能支付风控助手Stage1-RAG知识库升级 — 元数据让检索更精准
人工智能
武子康16 分钟前
调查研究-199 MCP Zero-Touch OAuth:为什么它是 MCP 进入企业生产的关键门槛?
人工智能·agent·mcp
冬奇Lab22 分钟前
每日一个开源项目(第144篇):ai-website-cloner-template - 一条命令、多 Agent 并行,把任意网站逆向成 Next.js 代码
前端·人工智能·开源
冬奇Lab22 分钟前
AI 原生组织不是买工具,而是让等待消失
人工智能·工作流引擎
半个落月34 分钟前
从数据集划分理解大模型的数据工程
人工智能
用户8299792943931 小时前
一文带你彻底搞懂claude code中的上下文压缩
人工智能
IT_陈寒1 小时前
Vue的这个响应式陷阱让我熬到凌晨三点
前端·人工智能·后端
冬奇Lab11 小时前
Workflow 系列(01):基础理论——三种执行模型与 Anthropic 5 种模式
人工智能·agent·工作流引擎
冬奇Lab11 小时前
每日一个开源项目(第143篇):page-agent - 纯 JS 的网页 GUI Agent,无需截图、无需插件、无需后端
前端·人工智能·agent
程序员cxuan13 小时前
虽迟但到!GPT-5.6 终于来了!
人工智能·后端·程序员