野鸡就是野鸡,你好指望它叫出凤凰的声音嘛!
这个比赛也是着实有趣,国内的比赛真的没法说,没啥好货,想学习东西还是去kaggle吧;
比赛目标:
- 针对历史空气指标数据,预测未来七天;指标包含包含SO2、NO2、CO、O3、PM10、PM2.5;
- 训练数据时间从2019年到2023年完整,但是从2024年只提供了7天,然后预测该7天后的指标情况,**这不是欺负老实人嘛!**也不知道官方什么逻辑。
- 不提供第三方数据,但是参赛选手可随意使用;
- 注意数据泄漏问题,不能使用超过测试集合最小时间的数据。但是我觉得大多数选手都在使用。因为起初大家都很难上分,但是到了最后出现骤增,一定是引用了第三方数据;
复赛阶段:
使用初赛的模型,直接对新的数据推导。
值得注意的是选手当中有一个使用了大模型,我也很好奇怎么做的!
20240905:今天比较搞笑的是,使用大模型的选手由于环境问题一直难以部署模型。在于官方battle,很是激烈。官方提供python3.8. 但是目前版本很难在这个环境部署比较新颖的东西,官方可能嫌麻烦不愿意更换环境。我是觉得可惜了,xgboost 对比大模型条件下,如果是我,我反正是会开一个环境给选手,给创新一点空间吧!