2025时空数据研究工作总结

2025年就要结束了,笔者尝试对今年在时空数据挖掘领域的工作进行了一次回顾,旨在总结今年时空领域的主要进展。和24年总结一样,2025年的时空数据挖掘不仅在传统任务上继续取得进展(这部分不再赘述,去年也是这么写的,这句话感觉能用n年),而且还涌现出了一些新的研究方向新的数据和更多新的可能。

:作为一个初学者,对于这个领域的理解还不够深入,我的观点可能显得有些浅薄和幼稚。尽管如此,我还是愿意分享在我学习过程中发现的一些有趣的文章和见解。我非常欢迎各位宝贵意见和指导,也请大家不吝批评,帮助我更好地成长和进步。(从今年开始我逐步对时空数据的研究减少,对该方面的认识可能变得愈发薄,当然如果有朋友愿意带我一起做点有价值的研究欢迎联系我,请大家尽情拍砖)

以下是我对2025年时空数据挖掘领域的一些观察和总结,供大家参考。

🌟【紧跟前沿】"时空探索之旅"与你一起探索时空奥秘!🚀

欢迎大家关注时空探索之旅时空探索之旅

1. 新研究方向

今年整体新研究方向感觉乏善可陈,但是为了尽可能和笔者往年的写法一致,还是写下相对有代表性的一些趋势。

1.1 稳健性(鲁棒性),高效性,扩展性,迁移性,泛化性

针对时空预测(尤其以交通预测为主)这个问题,所谓传统去打榜已经是很难再有好的进展了,今年这个现象尤为明显,大多数工作都结合一些新的设置方式或者新的场景来讲故事,通常这些设置和场景都是机器学习亟需解决的问题,包括但不限于如下场景:

稳健性

稳健性(鲁棒性):由于各种各样原因导致预测结果不够稳健,例如分布偏移,数据噪声等,因而专门采用一些设计来提高鲁棒性。**当然这个问题研究也有很长时间了,但是总能讲出一些新故事,**这里提到两篇工作:

KDD 2025 | Seeing the Unseen: Learning Basis Confounder Representations for Robust Traffic Prediction

链接 :++https://dl.acm.org/doi/10.1145/3690624.3709201++
代码 :++https://github.com/bigscity/STEVE_CODE++

TL; DR :有交通预测模型受天气、事故等混杂因素影响,且难以处理连续 / 未知混杂因素。提出STEVE模型,构建基混杂因素库,将各类混杂因素表示为基向量线性组合;通过 3 个自监督任务增强基库表达;用对抗解耦与互信息最小化分离混杂因素影响与直接因果关系,提升预测鲁棒性。

AAAI 2026 | DarkFarseer: Robust Spatio-Temporal Kriging Under Graph Sparsity and Noise

链接 :++https://arxiv.org/abs/2501.02808++

代码 :++https://github.com/DKRG-HEU/DarkFarseer++

TL; DR : 论文提出DarkFarseer,一个面向归纳式时空克里金(ISK)的鲁棒图神经网络框架,核心目标是在不预先知道虚拟传感器位置的情况下,仅凭物理传感器读数高精度推断任意空间点的时空序列。

高效性

高效性:现有方法可能限制了其在大规模数据集上的性能,且许多方法难以适应时空数据的动态变化,进一步增加了计算成本,如何能够训练和推理的更快。这里分享一篇(这类工作也很多了,尤其是DB的会议交通预测都得沾效率):

IJCAI 2025 | A Dynamic Stiefel Graph Neural Network for Efficient Spatio-Temporal Time Series Forecasting

论文链接 :++https://www.ijcai.org/proceedings/2025/0796++

代码链接 :++https://github.com/komorebi424/DST-SGNN++

TL; DR:本文提出了一种名为动态时空施蒂费尔图神经网络(Dynamic Spatio-Temporal Stiefel Graph Neural Network, DST-SGNN)的模型,用于高效处理时空时间序列预测问题。该模型通过引入施蒂费尔图谱卷积和施蒂费尔图傅里叶变换,以及线性动态图优化,有效地平衡了模型在处理动态时空关系时的效果和效率。DST-SGNN还采用了多层SGSC来捕捉复杂的时空相关性。通过在七个时空数据集上的广泛实验,DST-SGNN在保持较低计算成本的同时,优于现有的最先进方法。

可扩展性

可扩展性:大规模路网下,往往后算力资源受限,如何在这种情况下做更好的时空预测,与上面高效性的区别在于扩展性更侧重于空间规模的扩展,而高效性更多的是训练和推理时间上的缩短。

KDD 2025 | Efficient Large-Scale Traffic Forecasting with Transformers: A Spatial Data Management Perspectiveg

论文链接 :++https://arxiv.org/abs/2412.09972++

代码链接 : ++https://github.com/LMissher/PatchSTG++

这篇应该是去年就做过了解读,今年可扩展性的工作有所涌现。

TL; DR : 从空间数据管理的角度出发研究不均匀空间分布节点的patch 化方法,以将Transformer 从空间的patch-level 而非point-level 应用于大规模交通预测。

迁移性

迁移性:把旧领域学到的经验,用到新领域解决问题。时空预测的迁移学习较早应该可以追溯到这一篇工作:

IJCAI 2025 | Cross-City Transfer Learning for Deep Spatio-Temporal Prediction 谷歌学术引用267

论文链接 :++https://www.ijcai.org/proceedings/2019/0262++

今年迁移学习也有一些不错的工作:

IJCAI 2025 | Balancing Imbalance: Data-Scarce Urban Flow Prediction via Spatio-Temporal Balanced Transfer Learning

论文链接 :++https://www.ijcai.org/proceedings/2025/319++

TL; DR:针对数据稀缺城市的时空流量预测问题,提出STBaT时空平衡迁移学习框架,通过识别并校准源城市区域交通不平衡,让模型在无目标城市数据(零样本)或少量数据(少样本)场景下,同时实现预测的通用性和精准性

[Oral] NeurIPS 2025 | TransferTraj: A Vehicle Trajectory Learning Model for Region and Task Transferability

论文链接 :++https://openreview.net/forum?id=XQ87Vo9GIz++

代码链接 :++https://github.com/wtl52656/TransferTraj++

TL; DR: 提出一种车辆轨迹学习模型TransferTraj,该模型能够在不同区域和任务之间迁移而无需重新训练。

泛化性

泛化性模型 / 方法在训练 / 已知场景中学到的能力,能够稳定适配到未见过的新场景、新数据或新任务中,并保持有效性能------ 简单说就是 "举一反三" 的能力,是衡量方法是否能从 "实验室" 走向 "真实世界" 的关键指标。

与迁移性区别:泛化性聚焦 "单任务内跨数据 / 场景的适配",迁移性聚焦 "跨任务 / 跨域的知识复用",是解决 "模型突破训练限制" 的两种不同思路。

[Spotlight]NeurIPS 2025 | Learning with Calibration: Exploring Test-Time Computing of Spatio-Temporal Forecasting

论文链接 :++https://arxiv.org/abs/2506.00635++

代码链接 :++https://github.com/Onedean/ST-TTC++

TL; DR:这篇论文提出ST-TTC------ 一种时空预测的测试时计算新范式,核心是在不改动原有模型、不额外训练的前提下,通过轻量校准模块实时修正预测偏差,解决真实场景中数据噪声、分布偏移等问题。

NeurIPS 2025 | How Different from the Past? Spatio-Temporal Time Series Forecasting with Self-Supervised Deviation Learning

论文链接 :++https://openreview.net/forum?id=TgGH1bY6kl++

代码链接 :++https://github.com/Jimmy-7664/ST-SSDL++

TL;DR:提出了一种用于时空序列预测的新框架ST-SSDL,通过**自监督偏差建模(Self-Supervised Deviation Learning)**显式建模当前数据与历史状态之间的偏差,从而提升模型的泛化性与鲁棒性。

1.2 互联网大厂对时空相关业务的大模型探索

时空数据挖掘往往被诟病的一个点是难以落地,那么今年有关时空数据的相关业务各个大厂也争相开始发布自己的技术报告和相关论文。由于企业有着丰富的数据,能够基于自己的数据训练LLM或者大规模生成式模型,并做出来更多有应用前景的工作。

快手 | 两大本地生活推荐模型------OneLoc和LGSID

2025[arXiv]OneLoc: Geo-Aware Generative Recommender Systems for Local Life Service

论文链接 :++https://arxiv.org/abs/2508.14646++

TL; DR :提出了OneLoc ,这是一个针对本地生活服务场景的端到端生成式推荐系统。该系统旨在解决如何充分利用地理信息以及平衡用户兴趣、用户与店铺距离和业务目标等多目标的挑战。

AAAI 2026 | LLM-Aligned Geographic Item Tokenization for Local-Life Recommendation

论文链接 :++https://arxiv.org/abs/2511.14221++

代码 :++https://github.com/JiangHaoPG11/LGSID++

TL;DR:LGSID 是快手面向本地生活推荐的 LLM 对齐地理语义token框架,聚焦解决现有模型 "重语义、轻地理" 的痛点。通过 RL-based 地理 LLM 对齐(G-DPO 算法注入空间与协同信号)和分层token化(主token + 残差token),让语义 ID 具备地理感知,在判别式与生成式推荐中均超越 SOTA,显著提升地理适配性与推荐性能。


美团 | 本地生活的搜索基准LocalSearchBench和大模型基准LocalGPT

KDD 2025 | Benchmarking and Advancing Large Language Models for Local Life Services

论文链接 :++https://dl.acm.org/doi/10.1145/3711896.3737196++

代码链接 :++https://github.com/tsinghua-fib-lab/LocalEval++

TL; DR:针对通用大模型不适配本地生活服务、无专属评估标准的问题,提出 "LocalEval 基准 + 多 Agent 时空数据训练" 技术方案,实现小模型比肩大模型性能,落地美团提升核心业务指标。

LocalSearchBench: Benchmarking Agentic Search in Real-World Local Life Services

论文链接 :++https://arxiv.org/abs/2512.07436++

项目地址 :++http://localsearchbench.github.io/++

Huggind Face数据集 :++https://huggingface.co/datasets/localsearchbench/localsearchbench++

TL; DR :推出首个面向本地生活服务领域的智能搜索基准测试集 LocalSearchBench 及配套评估环境 LocalPlayground,,为本地生活服务领域的模型训练和技术优化提供标准化工具。


高德 | 生成式模型的POI推荐系统SpaceTime-GR和CoAST

Spacetime-GR: A Spacetime-Aware Generative Model for Large Scale Online POI Recommendation

论文链接 :++https://arxiv.org/abs/2508.16126++

TL; DR:Spacetime-GR是第一个成功应用于大规模工业在线POI推荐系统的生成式模型,通过引入时空信息编码和多模态POI嵌入,有效地解决了POI推荐中的时空敏感性问题。

高德生成式推荐大模型|Spacetime-GR------面向大规模线上POI推荐的时空感知生成式推荐模型预训练思考

Cognitive-Aligned Spatio-Temporal Large Language Models For Next Point-of-Interest Prediction

论文链接 :++https://arxiv.org/abs/2510.14702++

TL; DR :论文提出 CoAST(Cognitive-Aligned Spatio-Temporal Large Language Models) ,首次把"下一次 POI 预测"转化为认知对齐的生成式推荐任务,解决传统方法缺乏世界知识、反直觉推荐两大痛点。


滴滴 | 基于大模型的网约车助手:DiMA

KDD 2025 | DiMA: An LLM-Powered Ride-Hailing Assistant at DiDi

论文链接 :++https://dl.acm.org/doi/abs/10.1145/3711896.3737208++

代码链接 :++https://github.com/usail-hkust/DiMA++

TL; DR:DiMA(DiDi Mobile Assistant),这是一个基于大型语言模型(LLM)的智能助手,旨在为DiDi出行平台提供无缝的叫车服务。DiMA的核心目标是通过自然和高效的对话界面,在动态和复杂的时空城市背景下,实现便捷的叫车服务。

2. 技术类创新

今年最火的3个技术应该是年初Deepseek带来的慢思考R1范式Agent 以及RAG

2.1 DeepSeek-R1 慢思考

今年年初,DeepSeek-R1的慢思考方式引爆全网,也成为了今年的年度热词,原文目前也被Nature录用了。

所谓DeepSeek-R1的"慢思考"是一种模拟人类深度思考模式的人工智能推理方法。它不像传统模型那样直接给出答案,而是会先像人类解题一样,在心中(或屏幕上)逐步推导、分析和验证,最后才得出结论。今年时空和时序都有探索R1的范式,我们这里只讲时空相关的,这里分享两篇。

Traffic-R1: Reinforced LLMs Bring Human-Like Reasoning to Traffic Signal Control Systems

论文链接 :++https://arxiv.org/abs/2508.02344++

HF :++https://huggingface.co/Season998/Traffic-R1++

TL; DR:本文介绍了一个名为Traffic-R1的模型,它是一个基于强化学习(RL)和大型语言模型(LLM)的交通信号控制系统,旨在通过人类类似的推理能力来提高城市交通的流畅性和效率。该模型通过自我探索和迭代,结合专家指导,在模拟交通环境中进行训练,以解决传统方法在跨区域泛化、可解释性和对异常事件的鲁棒性方面的不足。

Urban-R1: Reinforced MLLMs Mitigate Geospatial Biases for Urban General Intelligence

论文链接 :++https://arxiv.org/abs/2510.16555++

TL; DR:本文提出Urban-R1------ 一种基于强化学习(RL)的多模态大模型(MLLM)后训练框架,核心是通过 "分组相对策略优化(GRPO)" 和 "城市区域画像(URP)智能体任务",解决现有城市智能模型的地理偏差(geo-bias) 问题,实现更公平、通用的城市通用智能(UGI),在 GDP 估算、选址、地理定位等任务中,性能超越监督微调模型和 GPT-4o 等闭源模型。

2.2 时空 Agent(ST Agent)

Agent的技术就很成熟了,但是时空尤其是对于预测单一任务而言,感觉很难套用Agent的概念,需要更复杂的任务。

对于时空智能体的思考我很推荐大家去看Yan Lin博士的博客分享,对于ST Agent的思考很有启发:

Spatiotemporal AI Agent Dilemma :++https://blog.yanlincs.com/ml-tech/st-agent-dilemma++

TL; DR:探讨了时空数据挖掘Agent(ST Agent)的设计相关问题。先明确agent与LLMs的差异:agent源于LLMs,但能多方式交互并自主决策,而LLMs本质是语言概率模型。接着指出构建 ST Agent的核心问题:LLMs处理时空数据有局限(数据稀疏易过拟合、对数字不敏感、性能提升有限却增模型规模),且必要性存疑(经典 ST 任务无需Agent,数据分析类任务或更适合硬编码)。并给出了建议:优先选简单方法,需构建时要发挥LLMs语言优势、针对需自动化的新场景,同时兼顾工程(借鉴行业工具)与学术(如设计反馈机制)。

这里也分享两篇时空数据对智能体的探索。


NeurIPS 2025 | TrajAgent: An LLM-Agent Framework for Trajectory Modeling via Large-and-Small Model Collaboration

论文链接 :++https://openreview.net/forum?id=9Ook5bXnPr++

代码链接 :++https://github.com/tsinghua-fib-lab/TrajAgent++

TL; DRTrajAgent 是一个基于大语言模型(LLM)的智能体框架,通过大模型和小模型协作 实现自动化轨迹建模。它解决了传统轨迹建模需要大量人工设计特征和模型选择的痛点。

AgentSense: LLMs Empower Generalizable and Explainable Web-Based Participatory Urban Sensing

论文链接 :++https://arxiv.org/abs/2510.19661++

TL; DR :本文提出AgentSense框架,用于网页端参与式城市感知,解决现有系统泛化性差、可解释性不足的问题。该框架融合传统规划器与大语言模型驱动的多智能体系统,先通过传统规划器生成初始方案,再由求解、评估、记忆三类智能体迭代优化,适配城市动态扰动与参与者偏好,同时生成自然语言解释。经两大移动数据集及七种扰动场景验证,其在适应性、稳健性和可解释性上均优于传统方法与单智能体大语言模型,为智能城市感知提供高效解决方案。

2.3 时空 RAG

RAG即检索增强生成(Retrieval-augmented Generation),其工作原理是通过检索大规模文档集合中的相关信息,然后利用这些信息来指导文本的生成,从而提高预测的质量和准确性。对于时空的任务,同样也有工作来利用RAG来提供预测的精度和质量,这里介绍几篇。


Spatial-RAG: Spatial Retrieval Augmented Generation for Real-World Geospatial Reasoning Questions

机器之心:开启空间智能问答新时代:Spatial-RAG框架来了

论文链接 :++https://arxiv.org/abs/2502.18470++

TL; DR:,论文提出了一个名为Spatial Retrieval-Augmented Generation(Spatial-RAG)的框架,旨在通过整合稀疏空间检索(利用空间数据库)和密集语义检索(基于LLM的相似性)来扩展RAG框架,使其能够处理空间任务。该框架通过多目标排名策略平衡空间约束和语义相关性,并利用LLM引导的生成器确保生成连贯的响应。

AAAI 2026 | A Retrieval Augmented Spatio-Temporal Framework for Traffic Prediction

论文链接 :++https://arxiv.org/abs/2508.16623++

TL; DR :作者将检索增强生成(RAG)思想首次引入时空预测,提出 RAST 框架:通过外部向量存储库动态保存并检索历史细粒度模式,在不增加主干网络参数的前提下,为当前预测提供即时的、高相关性的上下文补充,从而同时缓解容量不足与异质性难题。

TP-RAG: Benchmarking Retrieval-Augmented Large Language Model Agents for Spatiotemporal-Aware Travel Planning

论文链接 :++https://arxiv.org/abs/2504.08694++

TL; DR:针对LLMs在旅行规划中时空逻辑不足的问题,本文指出现有基准忽视了行程连贯性、景点吸引力及时间适应性。为此,研究提出了TP-RAG基准测试以评估LLMs的时空感知能力,并探索利用检索增强生成(RAG)方法,提升旅行规划的效率与合理性。

3. 综述

2025时空领域的综述重点也都集中在了基础模型与大模型,以及城市通用智能等方面。


3.1 时空基础模型

KDD 2025 | Foundation Models for Spatio-Temporal Data Science: A Tutorial and Survey

论文链接 :++https://dl.acm.org/doi/abs/10.1145/3711896.3736552++

TL; DR :本文系统综述了时空基础模型(Spatio-Temporal Foundation Models, STFMs)在城市计算、气候科学、交通预测等领域的应用潜力,首次从"数据感知-管理-挖掘-应用"的完整流程

TKDE 2026 | Unraveling Spatio-Temporal Foundation Models via the Pipeline Lens: A Comprehensive Review

论文链接 :++https://arxiv.org/abs/2506.01364++

项目仓库 :++https://github.com/LMissher/Awesome-Spatio-Temporal-Foundation-Models++

TL; DR:本文综述了时空基础模型(STFMs),涵盖数据预处理、模型设计、训练目标和迁移适应技术等方面,提出了数据属性分类法,讨论了模型在多领域的应用,并展望了未来研究方向,旨在提升模型性能和适用性。

Spatio-Temporal Foundation Models: Vision, Challenges, and Opportunities

论文链接 :++https://papers.cool/arxiv/2501.09045++

TL; DR:该论文系统探讨时空基础模型(STFMs)的愿景、核心挑战与发展机遇。这类模型通过融合空间与时间维度,旨在统一处理视频、交通流、气候预测等动态数据,在计算机视觉、自动驾驶、具身智能等领域应用前景广阔。主要挑战包括大规模高质量时空数据获取与标注困难、计算成本高昂、跨域泛化能力受限。未来方向聚焦于多模态时空融合、自监督预训练及构建通用智能体框架,为下一代时空AI研究提供系统性路线图。

3.2 城市智能体

Large Language Model Powered Intelligent Urban Agents: Concepts, Capabilities, and Applications

论文链接 :++https://arxiv.org/abs/2507.00914++

项目链接 :++https://github.com/usail-hkust/Awesome-Urban-LLM-Agents++

TL; DR:这篇论文提出LLM驱动的智能城市智能体新概念,旨在解决传统城市管理系统碎片化、缺乏灵活性的问题。这些"数字管家"通过自然语言理解、时空推理、工具调用和人类协同四大核心能力,能够整合交通、应急、规划等多源数据并自主决策,处理如动态交通疏导、应急响应优化等复杂真实场景。研究认为,LLM不仅是聊天工具,更将成为下一代城市大脑的核心引擎,推动城市治理从"自动化"迈向真正的"自主化"。

4. 数据集和Benchmark

同样,在2025年随着LLM和基础模型如火如荼的发展,时空领域也涌现了新的数据集和Benchmark

4.1 数据集

数据集今年有两个不错的数据集,分别聚焦于时空交通事件超长时空序列


[D&B] NeurIPS 2025 | TraffiDent: A Dataset for Understanding the Interplay Between Traffic Dynamics and Incidents

论文链接 :++https://openreview.net/forum?id=sZvXXPqONQ++

Github :++https://github.com/xaitraffic/xtraffic++

项目链接 :++https://xaitraffic.github.io/++

kaggle :++https://www.kaggle.com/datasets/gpxlcj/xtraffic++

TL; DR :该数据集整合了大规模区域的交通和事件数据,涵盖2023年全年的16,972 个交通节点。TraffiDent包含交通流量、车道占用率和平均车速的时间序列数据,以及七个不同类别的时空对齐事件记录。每个节点还包含详细的车道物理属性和政策层面的元属性。我们的目标是通过这个全面的数据集,增强交通管理和安全分析的可解释性及实际应用。

可能衍生的方向:事件感知的交通预测,事件模态融合的交通预测等等(预测包含插补,事件事故预测,异常检测等)。

SIGSPATIAL 2025 [最佳论文] | XXLTraffic: Expanding and Extremely Long Traffic Forecasting beyond Test Adaptation

论文链接 :++https://arxiv.org/abs/2406.12693++

代码链接 :++https://github.com/cruiseresearchgroup/XXLTraffic++

TL; DR::XXLTraffic用横跨23年、覆盖美国澳洲、数千传感器的"超长真实数据",用"超长真实数据"把交通预测从"明天堵不堵"直接升级到"两年后这条路新车流",直面真实场景中的分布漂移与时空演化挑战。传统SOTA模型在此任务上集体翻车,彻底重塑交通预测研究新基准!

4.2 Benchmark

Benchmark今年也聚焦于大模型在时空任务上的评测。这里分享两个工作:


KDD 2025 | CityBench: Evaluating the Capabilities of Large Language Models for Urban Tasks

论文链接 :++https://dl.acm.org/doi/10.1145/3711896.3737375++

代码链接 :++https://github.com/tsinghua-fib-lab/CityBench++

TL; DR:CityBench是系统评估大语言模型城市任务能力的基准框架,涵盖交通、规划、环境、公共安全等7大领域共29个代表性任务。通过整合多模态城市数据(传感器时序、地理空间、文本描述),全面测试LLM在城市空间推理、时序预测、资源优化等核心能力。研究揭示现有模型在城市上下文理解方面存在显著局限,为开发具备真正城市智能的LLM智能体提供了关键评估标准和改进方向。

WWW 2025 | STBench: Assessing the Ability of Large Language Models in SpatioTemporal Analysis

论文链接 :++https://dl.acm.org/doi/abs/10.1145/3701716.3715293++

代码链接 :++https://github.com/LwbXc/STBench++

TL; DR:STBench是一个评估大语言模型(LLM)时空分析能力的综合性基准测试框架。研究构建了包含空间推理、时间序列预测及时空预测等4类核心任务、19个数据集的评测体系。实验发现:LLM在时空任务中展现潜力但显著落后于专用模型;增加上下文信息可明显提升性能;模型规模与效果正相关,但在复杂时空推理上仍存在明显局限。该研究揭示了LLM在时空认知方面的关键瓶颈,为开发时空增强的大模型提供了重要参考。

5 行业亮点

5.1 顶会时空时序Tutorial

以往是会有一些workshop,比如KDD已经办了14届的Urban Computing(++https://urbcomp25.netlify.app/++),WWW办了2届的WebST(https://++webst2026.netlify.app/++),

今年各大顶会针对上针对时空数据的tutorial逐渐增多,,以下是我观察到的一些例子。


MM 2025 |时空数据的多模态学习

MM4ST: Multimodal Learning for Spatio-Temporal Data Mining

主页 :++https://mm4st.netlify.app/++

Github :++https://github.com/CityMind-Lab/MM4ST++

KDD 2025 | 时空基础模型教程

Foundation Models forSpatio-Temporal Data Science

这篇tutorial在上面综述部分已经介绍过。

主页 :++https://wenhaomin.github.io/FM4ST.github.io/++

论文链接 :++https://dl.acm.org/doi/abs/10.1145/3711896.3736552++

WWW 2025 | 大模型时代的网络中心人群移动分析

Web-Centric Human Mobility Analytics: Methods, Applications, and Future Directions in the LLM Era

主页 :++https://human-mobility.github.io/++

5.2 TPAMI上的时空预测

随着这两年的发展,机器学习三大会上的时空数据论文也变多了起来,但是笔者还是第一次看到能在TPAMI上发表的时空数据的文章。

TPAMI 2025 | ComS2T: A Complementary Spatiotemporal Learning System for Data-Adaptive Model Evolution

arXiv :++https://arxiv.org/abs/2403.01738++

论文链接 :++https://ieeexplore.ieee.org/abstract/document/11024209++

TL; DRComS2T 是一种面向时空数据预测的互补学习系统,创新性地融合傅里叶频域预测器与博弈粗糙集时域预测器,通过动态专家集成机制自适应调整权重以应对概念漂移。系统利用粗糙集边界区域和近似精度实时检测数据分布变化,触发模型在线演化。在城市交通流量和空气质量预测等任务中,ComS2T展现出卓越的鲁棒性和准确性,有效兼顾预测稳定性与对突变/渐进漂移的快速响应能力,为数据自适应模型演化提供了新范式。

6. 对2026的展望

最后,对未来一年的时空数据研究做一个趋势分析和展望,仍然属于胡乱说胡乱猜,期待被打脸,大家看个乐呵,也请尽情拍砖。分为2个方面来说。

6.1 视觉模型和多模态大模型

在多模态时空数据挖掘领域,当前研究主要聚焦于街景图像遥感图像的融合应用,通过多模态辅助提升时空分析的精度与鲁棒性。在时间序列预测方向,基于视觉语言模型的探索已取得显著进展,近期相关论文(如时空预测任务中的多模态融合案例)初步验证了该方法的有效性。展望未来,该领域将突破单一视觉模态的局限,逐步整合文本、音频、传感器数据等多元模态,构建更丰富的数据体系,从而推动时空预测模型的性能跃升与应用场景拓展。

同时,笔者非常希望各位有能力做多模态的研究者在严格遵守数据隐私、知识产权及学术规范的前提下,积极开源实验数据集,促进学术共同体协作创新,共同推动多模态时空数据挖掘向更深入、更实用的方向发展。

Vision-LLMs for Spatiotemporal Traffic Forecasting

论文链接 :++https://arxiv.org/abs/2510.11282++

6.2 模型推荐选择问题

时序今年有一篇工作我感觉很有趣,所有做预测模型的朋友我认为都可以参考:

ARIES: Relation Assessment and Model Recommendation for Deep Time Series Forecasting

论文链接 :++https://arxiv.org/abs/2509.06060++

TL; DR :本文提出ARIES框架,核心解决两大研究问题:一是现有基准数据集缺乏多样可控的时间序列模式,无法系统厘清时间序列属性与建模策略的关联;二是缺乏有效的深度学习预测模型推荐方法,导致实际应用中需大量试错、耗时耗力。框架通过构建多样化合成数据集、设计属性评估系统、大规模基准测试建模策略,明确了二者关联,进而实现可解释的模型推荐,填补了现有研究空白。

个人认为这是一个很好的出发点,针对越来越多的数据集,不同数据集的属性(如平稳性、周期性、波动性等)差异显著,单一模型难以在所有场景下保持 SOTA 性能,如果能通过对数据分析选择合适的模型未尝不是一个合理的解决思路。

同时,这一思路也呼应了上述新研究方向1中指出的"稳健,高效,迁移,泛化"等问题,不同模型解决的问题不同,选择的评价指标也应该有所不同,应该因"数"制宜,选择合适的模型。

尾声

再次感谢大家一路以来的支持!愿在新的一年里与各位读者相互学习,共同进步!

最后,本文分享的观点和相关文章仅代表笔者个人的初步思考,难免带有主观色彩和个人局限。希望读者能以轻松的心态阅读,并欢迎提出宝贵的意见和建议。欢迎随时"拍砖"指正,您的真知灼见将是笔者前行的宝贵动力。

最后,衷心祝愿大家:新年快乐,身体健康,科研顺遂,万事皆安!
2025已悄然步入尾声,2026必将迎来更多希望与精彩。让我们怀揣期待,共赴新程!!

,明确了二者关联,进而实现可解释的模型推荐,填补了现有研究空白。

外链图片转存中...(img-Qtr89ekU-1767173219040)

个人认为这是一个很好的出发点,针对越来越多的数据集,不同数据集的属性(如平稳性、周期性、波动性等)差异显著,单一模型难以在所有场景下保持 SOTA 性能,如果能通过对数据分析选择合适的模型未尝不是一个合理的解决思路。

同时,这一思路也呼应了上述新研究方向1中指出的"稳健,高效,迁移,泛化"等问题,不同模型解决的问题不同,选择的评价指标也应该有所不同,应该因"数"制宜,选择合适的模型。

尾声

再次感谢大家一路以来的支持!愿在新的一年里与各位读者相互学习,共同进步!

最后,本文分享的观点和相关文章仅代表笔者个人的初步思考,难免带有主观色彩和个人局限。希望读者能以轻松的心态阅读,并欢迎提出宝贵的意见和建议。欢迎随时"拍砖"指正,您的真知灼见将是笔者前行的宝贵动力。

最后,衷心祝愿大家:新年快乐,身体健康,科研顺遂,万事皆安!
2025已悄然步入尾声,2026必将迎来更多希望与精彩。让我们怀揣期待,共赴新程!!

以上

🌟【紧跟前沿】"时空探索之旅"与你一起探索时空奥秘!🚀

欢迎大家关注时空探索之旅时空探索之旅

相关推荐
小白开始进步2 小时前
USB相机连接与操作:基于OpenCV的完整实现
人工智能·数码相机·opencv
蕨蕨学AI2 小时前
【2025】个人学习与实践总结
经验分享·学习·改行学it
咕噜企业分发小米2 小时前
阿里云和华为云在AI视频领域有哪些扶持政策?
人工智能·阿里云·华为云
心止水j2 小时前
spark rdd
大数据·分布式·spark
Sui_Network2 小时前
Sui 2025 年终回顾:支付、BTC 与机构采用篇
大数据·人工智能·物联网·web3·去中心化·区块链
心态特好2 小时前
DenseNet-121 深度解析
人工智能
zstar-_2 小时前
FreeTool增加了四个新工具,并新增国内镜像站点
人工智能
2401_841495642 小时前
自然语言处理实战——基于BP神经网络的命名实体识别
人工智能·python·神经网络·算法·机器学习·自然语言处理·命名实体识别