效果&成本双突破!快手提出端到端生成式推荐系统OneRec!近日,快手推荐模型团队提出了一个端到端生成式推荐系统OneRec,该系统采用Encoder-Decoder架构,引入了基于奖励机制的偏好对齐方法,借助强化学习增强模型效果,可在奖励模型引导下直接生成契合用户偏好的视频内容。通过极致的性能优化,OneRec在推荐模型FLOPs提升10倍的同时,大幅削减了通信和存储等运营成本近90%。目前,OneRec已在快手/快手极速版双端承接25%的线上流量,带动APP停留时长分别提升0.54%和1.24%。