1- forecasting at scale论文阅读

目录

  • [1. 什么是时间序列](#1. 什么是时间序列)
  • [2. 什么是时间序列预测](#2. 什么是时间序列预测)
  • [3. 时间序列预测的范式](#3. 时间序列预测的范式)
  • [4. 时间序列的专有名词介绍](#4. 时间序列的专有名词介绍)
  • [5. 时间序列评估](#5. 时间序列评估)

1. 什么是时间序列

按时间先后顺序出现的有序序列

2. 什么是时间序列预测

  • 点预测:预测未来的某一个时间点,它的值到底是多少,例如明天的收盘股价、最高温度等。
  • 区间预测:明天的温度范围,例如-8~4°,落在这个范围的概率是多少

时间序列预测,不仅可预测,还要可定量预测。例如股票,你除了告诉我明天股票会涨,还要告诉我明天能涨多少。本博客介绍内容为定量预测

时间序列预测的前提:

  • 预测不会影响试图预测的结果:例如你预测股票明天涨幅10%,结果很多人听说该消息之后,没等涨到10%就开始抛售,导致股票跌了。
  • 过去的一些模式会在未来延续下去:过去的一些模式在未来一定会延续下去,我们一定是由于历史上出现了这样的时间序列趋势,所以我们才认为它未来有可能出现类似的趋势。例如2019年年底出现了新冠肺炎,导致2020年初每股有大通盘,这是黑天鹅事件。2020年一整年经济不好,对今天有很大影响。那如果想通过2019年以前的数据来预测2020年经济会不会出现崩盘,显然是不可能的。

3. 时间序列预测的范式

两个公式就是两个范式

  • y t y_t yt是观察变量,例如股票价格,工场的销量等。要通过历史的销售量 y t − 1 y_{t-1} yt−1和 y t − 2 y_{t-2} yt−2等来预测未来的销售量。 ϵ \epsilon ϵ表示误差。
  • 第二个范式, x t x_t xt称之为影响观察值的变量,又称为外部变量。

    上式(1)和(2)为基本范式,在此基础上可以衍生出各种各样的范式,如下举例:

4. 时间序列的专有名词介绍

理解专有名词,提高学习时间序列、看论文的效率。

  • 观察值: y t y_t yt
  • 外部变量: x t x_t xt,可能随着时间变化,也可能不随时间变换。

5. 时间序列评估

无论哪种预测,都要对预测效果进行评估;通过评估,才能对模型进行优化和迭代。

不能做交叉验证;

  • back test:也叫回测,意思是我用前面一段时间的数据做训练,后面一段时间的数据来做预测,这样就可以保证两边数据是没有交集的。不能出现训练数据中用到了未来的数据。
  • data leak:用2021和2023的数据做训练,去评估2022,也就是用未来的数据做训练,去预测过去,就是data leak。

    14:30
相关推荐
cqbzcsq16 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
凌晨一点的秃头猪16 天前
论文阅读 GTI(Graph-based Tree Index): 面向高维空间最近邻搜索的动态图-树混合索引结构
论文阅读
有Li16 天前
PTCMIL:基于提示 token 聚类的全切片图像多实例学习分析文献速递/多模态医学影像最新进展
论文阅读·学习·数据挖掘·聚类·文献·医学生
大模型最新论文速读16 天前
06-16 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
墨绿色的摆渡人16 天前
论文笔记(一百三十七)Learning Dual-Arm Push and Grasp Synergy in Dense Clutter
arm开发·论文阅读
Chunyyyen17 天前
【第四十九周】论文阅读
论文阅读
Biomamba生信基地17 天前
NC | 单细胞分析揭示头颈部癌早期转移过程中潜在的免疫逃逸机制(R语言版本)
论文阅读·生物信息学·单细胞rna测序
大模型最新论文速读17 天前
06-15 · LLM 最新论文速览
论文阅读·人工智能·深度学习·自然语言处理
小马哥crazymxm17 天前
Arxiv论文周选 (2026-W24)
论文阅读·人工智能·考研
大模型最新论文速读17 天前
TRUST:RL 时保留模型的不确定性,效果提升 8%
论文阅读·人工智能·深度学习·机器学习·自然语言处理