5 典型环境空气质量预测

汀沿河2024-09-05 12:43

DC竞赛------领先的大数据与人工智能竞赛平台

野鸡就是野鸡，你好指望它叫出凤凰的声音嘛！

这个比赛也是着实有趣，国内的比赛真的没法说，没啥好货，想学习东西还是去kaggle吧；

比赛目标：

针对历史空气指标数据，预测未来七天；指标包含包含SO2、NO2、CO、O3、PM10、PM2.5；
训练数据时间从2019年到2023年完整，但是从2024年只提供了7天，然后预测该7天后的指标情况，**这不是欺负老实人嘛！**也不知道官方什么逻辑。
不提供第三方数据，但是参赛选手可随意使用；
注意数据泄漏问题，不能使用超过测试集合最小时间的数据。但是我觉得大多数选手都在使用。因为起初大家都很难上分，但是到了最后出现骤增，一定是引用了第三方数据；

复赛阶段：

使用初赛的模型，直接对新的数据推导。

值得注意的是选手当中有一个使用了大模型，我也很好奇怎么做的！

20240905：今天比较搞笑的是，使用大模型的选手由于环境问题一直难以部署模型。在于官方battle，很是激烈。官方提供python3.8. 但是目前版本很难在这个环境部署比较新颖的东西，官方可能嫌麻烦不愿意更换环境。我是觉得可惜了，xgboost 对比大模型条件下，如果是我，我反正是会开一个环境给选手，给创新一点空间吧！