受到气候变化、温室效应以及人类活动等因素的影响,自然界中极端高温、极端环境污染、大洪水和大暴雨等现象的发生日益频繁;在人类社会中,股市崩溃、金融危机等极端情况也时有发生;今年的新冠疫情就是非常典型的极端现象。研究此类极端现象需要新的统计学方法,该类统计学的理论和方法都与传统的基于高斯分布的统计学模型有极大的不同。极值统计学就是专门研究自然界和人类社会中很少发生,然而发生之后有着巨大影响的极端现象的统计建模及分析方法;在水文、气象、环境、生态、保险和金融等领域都有着广泛的应用。为了帮助研究者更好的应用极值统计理论研究课题,开展基于R语言的极值统计学。
专题一 独立假设下的极值统计建模
主要内容包括:
1.广义极值模型
2.极小值的处理
3.广义Pareto模型
4.第r大次序统计量建模
5.R语言中极值统计学包
6.实例操作1-2 (提供案例数据及代码)
专题二 平稳时间序列的极值统计建模
主要内容包括:
1.时间序列的极值区分组模型
2.POT模型、Markov(马尔科夫)模型
3.实例操作3-5 (提供案例数据及代码)
专题三 极值回归
主要内容包括:
1.非平稳时间序列极值模型
2.协变量的极值统计模型及极值回归
3.实例操作6-7 (提供案例数据及代码)
专题四 点过程模型
主要内容包括:
1.点过程理论
2.超阈值点过程模型
3.实例操作8 (提供案例数据及代码)
专题五 贝叶斯极值统计学
主要内容包括:
1.贝叶斯统计学初步
2.极值模型的贝叶斯估计
3.实例操作9 (提供案例数据及代码)
专题六/七 极值统计学的高级课题
主要内容包括:
1.多元极值模型
2.极值Copula模型
3.实例操作10-11 (提供案例数据及代码)
4.答疑与交流
R语言的分位数回归实践技术高级应用
回归是科研中最常见的统计学研究方法之一,在研究变量间关系方面有着极其广泛的应用。由于其基本假设的限制,包括线性回归及广义线性回归在内的各种常见的回归方法都有三个重大缺陷:(1)对于异常值非常敏感,极少量的异常值可能导致结果产生巨大的误差;(2)对数据的分布有着较为苛刻的要求,如果数据不符合指定的分布,结果同样是不可信的;(3)只能估计因变量的条件均值,不能估计自变量对因变量分位点的不同影响。分位数回归的出现较好的解决了第(1)和第(3)个问题,对不同分布数据也表现非常好的稳定性。分位数回归是一种较新的回归技术,在实践中与普通的线性回归有很大区别,在理论上比线性回归复杂很多。
专题一:线性回归假设与分位数函数讲解
1.线性回归的本质
2.线性回归的基本假设
3.最小二乘法与极大似然法
4.线性回归的推广与分位数函数
专题二:线性分位数回归【代码实践】
1.最小一乘法及其推广
2.分位数回归结果的解释
3.显著性检验
4.分位数回归的拟合优度检验
专题三:贝叶斯分位数回归【代码实践】
1.贝叶斯统计学的基本概念
2.非对称拉普拉斯先验
3.贝叶斯分位数回归
专题四:超越线性分位数回归(一)【代码实践】
1.非线性分位数回归
2.非参数分位数回归
3.广义分位数回归及其贝叶斯版本
专题五:超越线性分位数回归(二)【代码实践】
1.线性分位数混合效应模型
2.CDF-分位数回归
3.分位数随机森林
基于现代R语言【Tidyverse、Tidymodel】的机器学习方法
机器学习已经成为继理论、实验和数值计算之后的科研"第四范式",是发现新规律,总结和分析实验结果的利器。机器学习涉及的理论和方法繁多,编程相当复杂,一直是阻碍机器学习大范围应用的主要困难之一,由此诞生了Python,R,SAS,STAT等语言辅助机器学习算法的实现。在各种语言中,R语言以编程简单,方法先进脱颖而出,本次机器学习基于现代R语言,Tidyverse,Tidymodel语法。