谷歌发布时序预测基础模型TimesFM,2亿参数,消费级GPU可运行,零样本时间序列预测新突破

前言

时序数据在零售、金融、制造、医疗和自然科学等各个领域无处不在,而时序预测则是这些领域中一项至关重要的任务。近年来,深度学习模型在处理丰富、多变量的时序数据方面取得了显著进展,往往优于传统的统计方法,例如 ARIMA 或 GARCH。然而,大多数深度学习模型都需要经过漫长而复杂的训练和验证过程,才能在新的时序数据上进行测试。因此,对于需要快速部署和应用的实际场景,这些模型存在局限性。

为了解决这一问题,Google Research 团队推出了全新的时间序列预测基础模型------TimesFM,它可以在无需额外训练的情况下,对未曾见过的时序数据进行预测,并且取得了令人印象深刻的性能。TimesFM 基于大型时序数据集的预训练,并采用解码器式的注意力模型架构,具有出色的泛化能力,能够在各种时间尺度和不同领域的数据集上进行有效预测。

技术特点

TimesFM 拥有以下关键技术特点,使其在时序预测领域具有显著优势:

  • 海量数据预训练,解锁强大的泛化能力

TimesFM 在一个包含 1000 亿个真实世界时间点的庞大时序数据集上进行预训练。这个数据集涵盖了各种领域、趋势和季节性模式,以及不同的时间粒度。这些丰富的数据帮助 TimesFM 学习到通用时序模式,并具备强大的泛化能力,能够对未曾见过的时序数据进行准确预测。

  • 解码器式注意力模型架构,高效处理时序数据

TimesFM 采用解码器式注意力模型架构,灵感源自自然语言处理领域的大型语言模型。在训练过程中,模型将时序数据分成多个连续的"patch",并通过堆叠的 Transformer 层对这些 patch 进行编码。每个 patch 可以看作是语言模型中的一个词元,模型能够根据之前看到的 patch 信息,预测下一个 patch 的内容。

  • 灵活的上下文和预测长度,适应多样化预测需求

TimesFM 的设计能够适应不同的上下文长度和预测长度,满足多样化的预测需求。例如,模型可以根据过去 32 个时间点的数据,预测未来 128 个时间点的趋势。

  • 轻量级模型设计,消费级 GPU 可运行

TimesFM 的模型参数规模仅为 2 亿,在消费级 GPU 上即可运行,降低了使用门槛,使其更容易被应用于各种实际场景中。

性能表现

TimesFM 在多个公共数据集上进行了零样本评估,其性能与在特定数据集上专门训练的监督学习模型相比毫不逊色。

  • 在 Monash Forecasting Archive 数据集上的表现: TimesFM 在包含数千个不同时间尺度和领域的时序数据的 Monash Forecasting Archive 数据集上,其零样本预测性能超过了大多数监督学习方法,包括 DeepAR 和 WaveNet 等深度学习模型。
  • 在 Darts 数据集上的表现: TimesFM 在 Darts 数据集上表现出色,其性能与 ARIMA 和 llmtime 等模型相当,而 llmtime 则使用了参数量远大于 TimesFM 的 GPT-3 模型。
  • 在 ETT 数据集上的表现: TimesFM 在 ETT 数据集上的表现优于 llmtime,并且与专门训练的 PatchTST 模型相比性能相当。

应用场景

TimesFM 的强大功能使其在各个领域具有广泛的应用潜力:

  • 零售预测: 预测商品销量,优化库存管理,减少成本,提升收益。
  • 金融预测: 预测股票价格,管理投资风险。
  • 能源预测: 预测电力需求,优化电力生产和分配。
  • 交通预测: 预测交通流量,优化交通路线规划。
  • 天气预测: 预测气温、降雨量等。

总结

TimesFM 的出现标志着时间序列预测领域迈入了新的阶段。它能够在无需额外训练的情况下,对未曾见过的时序数据进行预测,并且取得了令人印象深刻的性能。相信 TimesFM 将在未来推动时间序列预测技术的应用和发展,为各个领域的决策提供更准确、更可靠的参考。

模型下载

Huggingface模型下载

huggingface.co/google/time...

AI快站模型免费加速下载

aifasthub.com/models/goog...

相关推荐
Chef_Chen5 分钟前
从0开始学习机器学习--Day33--机器学习阶段总结
人工智能·学习·机器学习
搏博6 分钟前
神经网络问题之:梯度不稳定
人工智能·深度学习·神经网络
GL_Rain23 分钟前
【OpenCV】Could NOT find TIFF (missing: TIFF_LIBRARY TIFF_INCLUDE_DIR)
人工智能·opencv·计算机视觉
shansjqun27 分钟前
教学内容全覆盖:航拍杂草检测与分类
人工智能·分类·数据挖掘
狸克先生30 分钟前
如何用AI写小说(二):Gradio 超简单的网页前端交互
前端·人工智能·chatgpt·交互
baiduopenmap44 分钟前
百度世界2024精选公开课:基于地图智能体的导航出行AI应用创新实践
前端·人工智能·百度地图
小任同学Alex1 小时前
浦语提示词工程实践(LangGPT版,服务器上部署internlm2-chat-1_8b,踩坑很多才完成的详细教程,)
人工智能·自然语言处理·大模型
新加坡内哥谈技术1 小时前
微软 Ignite 2024 大会
人工智能
nuclear20111 小时前
使用Python 在Excel中创建和取消数据分组 - 详解
python·excel数据分组·创建excel分组·excel分类汇总·excel嵌套分组·excel大纲级别·取消excel分组
江瀚视野1 小时前
Q3净利增长超预期,文心大模型调用量大增,百度未来如何分析?
人工智能