问题背景:
我正在尝试复现一篇名为 "Zero-Shot Next-Item Recommendation using Large Pretrained Language Models" 的论文中的实验结果。
遇到的问题:
缺少关键代码: 我发现论文代码库中没有提供计算 HR@10 和 NDCG@10 这两个关键指标的代码。
指标结果差异大: 我根据自己的理解补充了计算 HR@10 的代码,并使用智朴 AI 大模型进行实验,但我得到的 HR@10 结果 (0.5-0.6) 远高于论文中报告的结果。
无法复现论文结果: 由于以上问题,我无法复现论文中报告的实验结果。
我的需求:
获得缺失的代码: 我希望论文作者能够提供计算 HR@10 和 NDCG@10 的代码,以便我和论文中的评估方法保持一致。
获得指导建议: 如果我的代码实现有问题,我希望论文作者能够提供一些指导建议,帮助我纠正问题并复现论文结果。