2020年五一杯数学建模
A题 煤炭价格预测问题
原题再现
煤炭属于大宗商品,煤炭价格既受国家相关部门的监管,又受国内煤炭市场的影响。除此之外,气候变化、出行方式、能源消耗方式、国际煤炭市场等其他因素也会影响煤炭价格。请完成如下问题。
1. 请建立数学模型,通过量化分析的方法,给出影响煤炭价格的主要因素(不超过10种),并且以秦皇岛港动力煤价格为例,给出从2019年5月1日至2020年4月30日,影响秦皇岛港动力煤价格的主要因素的排序(按影响程度从大到小排序,不超过10种)。
2. 请结合秦皇岛港动力煤价格的历史数据(附件1),以及问题1中的影响煤炭价格的主要因素,建立煤炭价格预测模型,分别以天、周、月为单位,预测未来31天、35周、36个月的煤炭价格,并完成表1。
3. 为了更加准确地预测秦皇岛港动力煤价格,请综合考虑未来各种情况(例如突发事件)引起的煤炭价格影响因素在结构性和重要性方面的变化,建立煤炭价格综合预测模型,并给出模型的预测结果。
4. 为保障我国未来煤炭市场的平稳发展,请结合问题3的模型,向政府部门提供相关的政策建议。
注:
(1)附件1-秦皇岛港动力煤价格数据由"中国煤炭市场网"提供(https://www.cctd.com.cn/),数据是以"周"为单位的数据,相关的煤炭价格是日期所在周的价格。
(2)本题中相关参数说明如下:
秦皇岛港动力煤:硫份0.8%,发热量5500kacl/kg;
煤炭价格类型:煤炭平仓价(FOB价格,是指煤运到港口并装到船上的价格);
煤炭价格单位:元/吨。
整体求解过程概述(摘要)
本文主要建立了影响煤炭价格影响因素模型,并且对未来一段时间的煤炭价格进行预测,最后考虑了突发事件对煤炭价格的影响。
在建立煤炭价格的影响因素模型时,我们选取了煤炭的生产量、可供量等二十二个因素进行逐步回归,得到回归方程之后通过系数的绝对值大小排序来确定影响煤炭价格的主要因素是全国铁路煤炭发运量和国际煤炭价格。之后我们又选取了原煤产量当期值、进口煤量、火力发电当期值、钢材产量当期值、全国铁路煤炭发运量、国际煤炭价格和国际石油价格七个因素构建影响秦皇岛煤炭价格的模型,检验这七个变量的多种共相关性得到影响秦皇岛煤炭价格各个因素影响效果的排序。
预测煤炭价格时我们使用SPSS软件进行时间序列分析,以价格为因变量,选取附件1的数据为样本数据为样本数据,对煤炭价格数据进行分析,建立ARIMA模型对煤炭价格进行预测未来31天、35周、36个月的煤炭价格。
在考虑未来突发事件对煤炭价格的影响时,首先检验了2006年7月3日~2020年4月30日这段时间内的突变点。之后使用分形理论来预测煤炭市场的价格。将4次突变点煤炭价格变动的绝对值的平均值作为突发因素加入预测模型,得到面对突发因素时的煤炭价格区间。
模型假设:
一.由于政策一般具有长期性和稳定性且难以量化,所以假设政策在一段时间保持稳定不发生大的变化。
二.假设所有统计到的数据都真实有效。
三. 统计国际石油市场价格时不考虑多种进货渠道,以WTI价格指数为准。
四. 煤炭开采技术一段时间保持稳定,即开采成本一段时间保持稳定。
问题分析:
对于问题一,我们用y表示煤炭价格,之后通过查找资料我们又收集了与煤炭价格相关的22个因素,将它们作为自变量 xn(其中x表示第n个自变量)组成候选变量集合。运用MATLAB的逐步回归程序计算,最后得到回归方程,通过回归方程中各个因素的系数来判断各个因素对煤炭价格的影响。之后检验了变量的多种共相关性,用各个自变量系数的绝对值去衡量影响因素和对价格的贡献率就可以得到影响因素的排序。
对于问题二,通过对秦皇岛港动力煤价格的走势分析,以及问题1中得出的影响煤炭价格的主要因素,以价格为因变量,选取附件1的数据为样本数据为样本数据,我们选取ARIMA模型建立煤炭价格预测模型,分别以天、周、月为单位,预测未来31天、35周、36个月的煤炭价格。
对于问题三,我们首先求出2006~2020中每个月的价格平均值作为新的序列,之后检测突变点,将突变点价格变动绝对值的平均值作为突发因素。之后使用分形理论建立煤炭价格的预测模型,再将突变因素加入模型。
模型的建立与求解整体论文缩略图
全部论文请见下方" 只会建模 QQ名片" 点击QQ名片即可
程序代码:(代码和文档not free)
bash
load sn.txt
[m,n]=size(sn);
x0=sn(:,[1:n-1]);y0=sn(:,n);
hg1=[ones(m,1),x0]\y0;
hg1=hg1'
fprintf('y=%f',hg1(1));
for i=2:n
if hg1(i)>0
fprintf('+%f*x%d',hg1(i),i-1);
else
fprintf('%f*x%d',hg1(i),i-1)
end
end
fprintf('\n')
r=corrcoef(x0)
xd=zscore(x0);
yd=zscore(y0);
[vec1,lamda,rate]=pcacov(r)
f=repmat(sign(sum(vec1)),size(vec1,1),1);
vec2=vec1.*f
contr=cumsum(rate)
df=xd*vec2;
num=input('请选项主成分的个数:')
hg21=df(:,[1:num])\yd
hg22=vec2(:,1:num)*hg21
hg23=[mean(y0)-std(y0)*mean(x0)./std(x0)*hg22, std(y0)*hg22'./std(x0)]
fprintf('y=%f',hg23(1));
for i=2:n
if hg23(i)>0
fprintf('+%f*x%d',hg23(i),i-1);
else
fprintf('%f*x%d',hg23(i),i-1);
end
end
fprintf('\n')
rmse1=sqrt(sum((hg1(1)+x0*hg1(2:end)'-y0).^2)/(m-n))
rmse2=sqrt(sum((hg23(1)+x0*hg23(2:end)'-y0).^2)/(m-num))