论文笔记：Estimating future human trajectories from sparse time series data

sigspatial 2023 humob竞赛paper

1 数据集分析

这里只分享了HuMob数据集1的内容

------>识别了任务1数据集中最有可能是非工作日的日子

提出方法的基石，依赖于基于规则的机制
- 用于预测常规和习惯性的移动，特别擅长处理工作日和常规商业时间的场景
- 引入时间衰减因子增加了动态性，使模型能够适应用户不断变化的日常活动
- k是通过经验优化训练数据的性能得到的，0.0063

方法3 的目标是通过智能选择方法1和方法2生成的预测，使用 GEOBLEU 或 DTW 评估指标作为选择标准，以提高最终位置预测的准确性
- 对于方法1和方法2，每天为每个用户计算 GEOBLEU 或 DTW 得分
- ------>允许我们识别出每个具体日子哪种方法产生了更准确的预测
为了促进分类任务，论文合并了反映用户行为的各种特征
- 用户移动的倾向性和变化性
- 不同时间段的活跃度水平
- 位置数据的分散性
- ------>通过整合这些多样化的特征，旨在捕捉用户行为的细微模式，从而增强模型在每个实例中准确选择更优方法的能力
采用了四种不同的模型集成------随机森林、XGBoost、LightGBM 和 CatBoost

对于方法1、2和3，某些时间步骤由于缺乏历史数据而无法生成预测结果。为了解决这一问题，采用了系统的后处理程序，确保最终位置预测的全面性和可靠性。程序包括以下步骤：