1- forecasting at scale论文阅读

目录

  • [1. 什么是时间序列](#1. 什么是时间序列)
  • [2. 什么是时间序列预测](#2. 什么是时间序列预测)
  • [3. 时间序列预测的范式](#3. 时间序列预测的范式)
  • [4. 时间序列的专有名词介绍](#4. 时间序列的专有名词介绍)
  • [5. 时间序列评估](#5. 时间序列评估)

1. 什么是时间序列

按时间先后顺序出现的有序序列

2. 什么是时间序列预测

  • 点预测:预测未来的某一个时间点,它的值到底是多少,例如明天的收盘股价、最高温度等。
  • 区间预测:明天的温度范围,例如-8~4°,落在这个范围的概率是多少

时间序列预测,不仅可预测,还要可定量预测。例如股票,你除了告诉我明天股票会涨,还要告诉我明天能涨多少。本博客介绍内容为定量预测

时间序列预测的前提:

  • 预测不会影响试图预测的结果:例如你预测股票明天涨幅10%,结果很多人听说该消息之后,没等涨到10%就开始抛售,导致股票跌了。
  • 过去的一些模式会在未来延续下去:过去的一些模式在未来一定会延续下去,我们一定是由于历史上出现了这样的时间序列趋势,所以我们才认为它未来有可能出现类似的趋势。例如2019年年底出现了新冠肺炎,导致2020年初每股有大通盘,这是黑天鹅事件。2020年一整年经济不好,对今天有很大影响。那如果想通过2019年以前的数据来预测2020年经济会不会出现崩盘,显然是不可能的。

3. 时间序列预测的范式

两个公式就是两个范式

  • y t y_t yt是观察变量,例如股票价格,工场的销量等。要通过历史的销售量 y t − 1 y_{t-1} yt−1和 y t − 2 y_{t-2} yt−2等来预测未来的销售量。 ϵ \epsilon ϵ表示误差。
  • 第二个范式, x t x_t xt称之为影响观察值的变量,又称为外部变量。

    上式(1)和(2)为基本范式,在此基础上可以衍生出各种各样的范式,如下举例:

4. 时间序列的专有名词介绍

理解专有名词,提高学习时间序列、看论文的效率。

  • 观察值: y t y_t yt
  • 外部变量: x t x_t xt,可能随着时间变化,也可能不随时间变换。

5. 时间序列评估

无论哪种预测,都要对预测效果进行评估;通过评估,才能对模型进行优化和迭代。

不能做交叉验证;

  • back test:也叫回测,意思是我用前面一段时间的数据做训练,后面一段时间的数据来做预测,这样就可以保证两边数据是没有交集的。不能出现训练数据中用到了未来的数据。
  • data leak:用2021和2023的数据做训练,去评估2022,也就是用未来的数据做训练,去预测过去,就是data leak。

    14:30
相关推荐
大写-凌祁2 小时前
论文阅读:HySCDG生成式数据处理流程
论文阅读·人工智能·笔记·python·机器学习
颜妮儿5 小时前
论文笔记——相干体技术在裂缝预测中的应用研究
论文阅读
柠石榴5 小时前
【论文阅读笔记】《A survey on deep learning approaches for text-to-SQL》
论文阅读·笔记·深度学习·nlp·text-to-sql
张较瘦_5 小时前
[论文阅读] 人工智能 | 搜索增强LLMs的用户偏好与性能分析
论文阅读·人工智能
Jamence7 小时前
多模态大语言模型arxiv论文略读(111)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
Jamence9 小时前
多模态大语言模型arxiv论文略读(110)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
迪娜学姐10 小时前
GenSpark vs Manus实测对比:文献综述与学术PPT,哪家强?
论文阅读·人工智能·prompt·powerpoint·论文笔记
张较瘦_1 天前
[论文阅读] 人工智能+项目管理 | 当 PMBOK 遇见 AI:传统项目管理框架的破局之路
论文阅读·人工智能
张较瘦_1 天前
[论文阅读] 人工智能 | 大语言模型计划生成的新范式:基于过程挖掘的技能学习
论文阅读·人工智能·语言模型
0x2111 天前
[论文阅读]TrustRAG: Enhancing Robustness and Trustworthiness in RAG
论文阅读