技术栈

语义id

GRITJW
7 小时前
语义id
语义ID论文精读《Better Generalization with Semantic IDs: A Case Study in Ranking for Recommendations》在推荐系统的广袤世界里,物品ID(Item ID)如同每个物品的“身份证”,是模型识别与记忆它们的基础。长期以来,我们习惯于使用随机哈希ID (Randomly-hashed IDs),这种方法凭借其高效的记忆能力,在工业界大规模排序系统中占据着主导地位。然而,这种“死记硬背”的方式也带来了明显的弊端:模型对新出现的、缺乏交互的长尾物品束手无策,因为这些随机ID本身不携带任何语义信息,无法帮助模型进行泛化推理。
我是有底线的