文章目录
认识数学建模及国赛
认识数学建模
环境类
:预测一下明天的气温
实证类
: 评价一下政策的优缺点
农业类
: 预测一下小麦的产量
财经类
: 分析一下理财产品的最优组合
规划类
: 土地利用情况进行 合理的划分
力学类
: 找出标枪运动员最佳的投掷点
- 很多事情无法直接凭借主观经验获取,需要用科学的方法进行解算,此过程便是数学建模。
- 几乎所有的行业都要用到
数学建模
!
什么是数学建模?
官方解释:数学模型
(Mathematical Model)是一种模拟,是用数学符号、数学式子、程序、图形 等对实际课题本质 属性的抽象而又简洁的刻画 ,它或能解释某些客观现象,或能预 测未来的发展规律,或能为控制某一现象的发展提供某种意义下的最优策略或较好策略
。数学模型一般并非现实问题的直接翻版,它的建立常常既需要人们对现实问题深入细微的观察和分析,又需要人们灵活巧妙地利用各种数学知识。这种应用知识从实际课题中
抽象、提炼出数学模型的过程就称为数学建模(Mathematical Modeling)。
数学建模比赛
目前数学建模比赛主要分为以下几个级别:
一级
:国赛;研赛;美赛;深圳杯二级
:MathorCup;电工杯;APMCM;三级
:五一赛;华东杯;华中杯;小美赛;数维杯;中青杯;网挑赛...
国赛参赛规则、评奖原则
数学建模国赛
是由中国工业与应用数学学会每年一届举办的全国性建模赛事,该竞赛创办于1992
年,每年一届,是首批列入"高校学科竞赛排行榜"
的19项竞赛之一。 2023年全国大学生数学建模竞赛
共1685所院校/校区、59611队(本科54158队、专科5453队)、近18万人
报名参赛。国奖获奖率约3%左右。
- 赛题于竞赛开始时(9月5日(周四)18:00至9月8日(周日)20:00)发布在全国大学生数学建模
竞赛官网、中国大学生在线、高等教育出版社、中国高校数学建模课程中心、中国数模等网站。 - 档次:最高级
- 报名方式:
学校统一报名
- 获奖比例:
在各赛区内部评选优秀论文至国奖,评出全国一等、二等奖,获奖比例为百分之三
左右。各地区
省奖获奖比例不固定,分为省一省二和省三,省奖综合获奖率30%
左右
官网:http://www.mcm.edu.cn/
如何评省、国奖
➢评奖办法
- 1.各赛区组委会聘请专家组成赛区评阅专家组,评选本赛区的
一等奖、二等奖(也可增设三等奖)
。 - 2.各赛区组委会按全国
组委会
规定的数额将本赛区的优秀答卷送全国组委会
。全国组委会聘请专家
组成全国评阅专家组,按统一标准从各赛区送交的优秀答卷中评选出全国一等奖、二等奖
。 - 3.对违反竞赛规则的参赛队,一经查实,即取消评奖资格,并由全国组委会(或赛区组委会)根据具体情况作出相应处理
根据往年的情况来看,有答辩环节
的赛区有:湖北赛区、四川赛区、重庆
赛区、甘肃赛区、陕西赛区、浙江赛区、
云南赛区、广西赛区、河南赛区、广东
赛区等
评奖规则
1.到底是如何评奖的,是不是有参考答案?
2.是全省竞争还是校内竞争
国赛和美赛纯靠论文的水平不一样,美赛跟你所在的学校没有关系,但国赛是跟这个挂钩的
比如说你国赛每个题每个学校只能推荐两个国一、两个国二,所以国赛本质上是校内竞争
3.国奖名额是组委会选还是学校评选
一般都是学校上报赛区组委会,赛区组委会报全国组委会。对于高水平的论文,像国赛的省一,很
多其实很难分出个高下和差别,那这个时候哪些该推到国奖,哪些不是国奖就会出现尺度不一的情况。
所以要正在比赛前尽可能的提升自己获奖的概率(积极参加活动,参加社团,跟数模主要负责老师混熟,
最好是挂往年国奖挂的那个指导老师等)
- 指导老师的作用
如何才能获奖
➢ 获奖套路
- 合适的模型和算法:数模三阶段,小白------套路------合适------创新
- 正式且美观的版面:无论是竞赛还是学术论文,良好的排版及图表的展示效果都是基础
- 巧用多模性对比,印证你的算法和模型
- ⭐ 论文的"论文性":注意这是在写论文,而不是应用题
- 问有所答......
模型和算法决定你的下限,论文决定你的上限!!
国赛赛题分类及选题技巧
国赛赛题特点
➢ 赛题:本科组ABC任选一道;专科组D和E题,也可以选ABC
➢ A题偏向物理/工程类(机理分析):
- 专业性较强,往往有标准答案,没有相关知识不建议选择,但如果能完成获奖率较高
- 往往需要用到微分方程和偏微分方程建模
- 求较优解的启发式算法一般不适用,比如神经网络,遗传算法等
➢ B题目前题型不固定,20/21年是优化类题目,22年是机理分析类,23年是机理分析类(优化)
➢ C题偏向经营/运筹优化/统计/数据分析类 - 赛题较开放易读懂
- 一般没有严格最优解,结果合理即可
- 参与的队伍多,难以脱颖而出
赛题分类
根据数学建模国赛历年出题点可知,赛题类型主要集中在优化类问题、评价类问题、预测类问题
和机理分析类四部分,其中优化类赛题和机理分析类赛题出现的频率最高,尤其是优化类赛题,去年
五个题四个都结合了优化问题!
数学建模分工技巧
建模员
需要系统了解各类模型
。如模型的主要功能是什么?该模型
的适用场景是什么?实现该模型需要哪些条件?模型有哪些
缺点或不足,可以做出那些改进?
编程员
需要掌握Matlab/Python。能够熟练掌握编程基础
;能够
实现各类常见算法;能够对程序Bug做出改正能够熟练利
用编程或软件制作精美图片
(美赛图片美观尤其重要)
写作员
需要熟练撰写论文各模块内容。需掌握学术语言规范;明
白论文各模块写作要求;能够对论文进行排版。同时也要
掌握绘图和美化图片
的技能。
注意事项
1、优先选择靠谱
而不是所谓的大佬;
2、队长要进行合理统筹安排
,强烈建议定期召开"组会
" ;
3、明确三人的主要分工
,确保写作/建模/编程团队都具备;
4、合理安排时间
,不建议比赛前期就通宵熬夜;
5、遇见问题要少数服从多数
,或者听从能力较强者的意见,防
止因意见不合产生矛盾,开赛后尽量快速定题,不要轻易换题。
数模必备软件
论文写作
- WORD(或WPS) :论文写作专用,并可以导成PDF格式
- EXCEL:分析数据、并绘制数据走势图等精美图片
- Mathtype:公式编辑器,用于编写各类数学公式和特殊符号
- Mathpix:公式提取软件,用于将其他论文的公式提取到自己论文中
- LaTeX/Overleaf:论文排版软件,主要利用编程语言对论文进行排版
编程代码
- Matlab/Python:交互式编程软件,将海量算法或工具进行封存,可
直接调用 - SPSS:专业的统计数据分析软件,有大量统计模型可直接使用
- Lingo:交互式的线性和通用优化求解器,可以用于求解各类规划模型
作图软件
- VISIO/亿图:主要制作各类流程图和部分结构图等
- Excel/PPT:Excel和PPT也可以绘制及其美观的图片
- Axglyph:专业的实用型矢量绘图工具
- Echarts/hiplot:在线数据可视化图表库,必学!!!
- Origin:作图以及插值拟合很方便的软件,数据可视化非常强。
辅助神器:ChatGPT
数模资料文献数据收集
资料收集平台
- 百度搜索:国内最常用的搜索工具,除了直接搜索,我们还要学会高级搜索
- 知乎:中文高质量原创内容平台,可搜索数学建模模型代码及各种干货
- CSDN:全球知名中文IT技术交流平台,可解决各种模型代码及编程软件相关问题
- ChatGPT:可联网的GPT版本,如NewBing等,可按要求帮你全网搜集所需资料
文献查找技巧
- 百度学术:百度旗下的免费学术资源搜索平台,提供海量中英文文献检索服务
- 知网:提供中国学术文献、外文文献、学位论文等各类资源统一检索、在线阅读和下载服务
- 谷歌学术(镜像站):提供维普、万方数据等各大学术文献资源库的检索服务
- SCI-HUB:免费提供各类英文文献资源,可通过doi号直接下载
- 学校图书馆:学校图书馆一般买了各类数据库,各类文献可直接下载
PS:推荐浏览器插件,easyScholar,可显示文章等级 - ChatGPT:可联网的GPT版本,如NewBing等,可按要求帮你全网搜集所需文献
数据收集网站
- CNKI 中国知网经济社会大数据研究平台:https://data.cnki.net/
- 大数据导航(各国统计局/世界银行/世界卫生组织/粮农组织数据中心等):http://hao.199it.com/
- EPSDTA:https://www.epsnet.com.cn/index.html#/Index
- 联合国数据:https://data.un.org/Default.aspx
- Github:https://github.com/awesomedata/awesome-public-datasets
ICPSR:https://www.icpsr.umich.edu/web/pages/ICPSR/index - 数据世界:https://ourworldindata.org/
- Kaggle数据集:https://www.kaggle.com/datasets
- 天池数据集:https://tianchi.aliyun.com/dataset/
数模国赛高分套路
推荐教材
• Matlab:《数学建模算法与应用》
《数学建模算法与程序》
• Python:《Python数学实验与建模》
➢ 特点
原理和例题十分详细,案例过程是按照数模论文的逻辑数
学的,并且附带有详细的代码
➢ 学习方法:
建模手:可以简单看下原理,然后直接去看各个案例,学
习模型的应用技巧
编程手:把代码(尤其是案例代码)跑一遍!
论文技巧
学会模仿
• 绝大部分优秀论文都有极为相似的套路和格式,各个部分该怎么写,不能怎么写,包括论文
长度,绘图等细节,都能从优秀论文学习得到。所以大家一定要多看历年优秀论文,特别是
20年后的,找他们的共同之处进行模仿。
着重摘要
➢ 着重摘要
• 摘要在国赛和美赛中重要程度已经反复提过很多次了,一定是重中之重,获奖论文通常会根
据摘要的质量与其他论文区分开来。建议对照往年优秀论文来写摘要,优秀论文的模型算法
学不来,摘要还是一定要学的。
常用模板
开头段:针对什么问题,建立了什么模型
针对问题一,建立的模型+求解的过程+得到的数值+意义
针对问题二,......
针对问题三,......
结尾总结段:模型的优缺点,灵敏度分析等,以及可以
改进的方面(非必要)
模型名称,算法名称,关键变量,模型结果
常常要加粗
注意摘要页控制在一页
内
注意:
模型算法的专有名词
不能错,每一
小问,都要给一个明确的结果
(数
值或文字描述),每一个关键模型,
都要结合题目去描述如何设置参数 和求解
,但整体语言必须力求不影
响读者理解的前提下,越精练越好
。
若摘要写的逻辑混乱、评委找不到
模型和每一问的求解结果,就与获
奖无缘。
一个可以用来评价摘要质量的好方法是:"如果某人只读了摘要而未读报告的其他部分,他能大概知
道问题是什么、我们做了什么、我们的结论是什么以及我们的建议是什么吗?"
一个可以用来评价摘要质量的好方法是:"如果某人只读了摘要而未读报告的其他部分,他能大概知
道问题是什么、我们做了什么、我们的结论是什么以及我们的建议是什么吗?"
重视分析,多论证算法合理性
➢ 重视分析
• 所有优秀论文都逃不出一个共性,就是分析到位。这听上去很简单,不过能将这点做好的人
并不多,很多人就是放个图放个数据就结束了,模型的选择也没有充分的说明论证。
• 老师看到一张结果图的时候,他是看不明白的。这时候你一定要把你的分析写在结果图的上
下,而且越多越详细越好。千万不要只有一张图和一行分析就了事了,此是论文大忌。
灵敏度分析
灵敏度分析
• 灵敏性分析一般在论文结尾,是绝对的加分项,最好需要有图有分析。此外还有模型检验、
误差分析、有效性分析、鲁棒性分析、适用条件分析、横纵向对比等。
• 灵敏度分析要结合文字进行解释说明,不要为了灵敏度分析而分析,要说明为什么对某个参
数做灵敏度分析,通过结果可以说明什么?
做好排版
➢ 做好排版
• 完美的排版是高分的基础。
matlab
function x = gaussianElimination(A, b)
b = b(:);
[n, ~] = size(A);
if length(b) ~= n
error('系数矩阵A和常数项向量b的维度不匹配');
end
Ab = [A b];
for k = 1:n-1
for i = k+1:n
factor = Ab(i,k) / Ab(k,k); % 计算乘数
Ab(i,k:end) = Ab(i,k:end) - factor * Ab(k,k:end); % 减去相应倍数
end
end
% 回代求解
x = zeros(n,1);
for i = n:-1:1
x(i) = (Ab(i,end) - Ab(i,i+1:end) * x(i+1:n)) / Ab(i,i);
end
end
常见赛题及模型
数学建模赛题类型主要分为:评价类、预测类和优化类
三种,其中优化类是最常见的赛题类型,几乎每年的地区赛或国赛美赛等均有出题,必须要掌握并且熟悉。
下图为常见的模型分类,机理分析类基本上建立完机理方程后仍然要转换成优化问题,数理统计类大部分都是和预测相关。
评价类赛题
综合评价是数学建模中的一类常见的问题,在国赛和美赛中都经常出现,例如国赛05年长江水质的综合评价、2010年上海世博会影响力的定量评估问题、2014年美赛"最好大学教练"问题、2015年的"互联网+"时代的出租车资源配等,都属于综合评价类问题。
综合评价问题是数学建模问题中·思路相对清晰的一类题目,从每学期的综合测评、旅游景点的选择到挑选手机,评价类问题在生活中也是处处存在。
主客观评价问题的区别
- 主客观概念主要是在
指标定权
时来划分的。主观评价与客观评价的区别是,主观评价算法在定权时主要以判断者的主观经验为依据,而客观评价则主要基于测量数据的基本特 性来综合定权
- 定权带有一定的主观性,用不同方法确定的权重分配,可能不尽一致,这将导致权重分配的不确定性,最终可能导致评价结果的不确定性。因而在实际工作中,不论用哪种方法确定权重分配,都应当依赖于较为合理的专业解释。
如何选择合适的评价方法在评价类问题的分析中,如何选择
合适的评价方法
是决定评价结果好坏的关键因素,因此需要洞悉各常用评价方法的基本特性和使用条件才能顺利答题
预测类赛题
预测类赛题的基本解题步骤
预测就是根据过去和现在估计未来,预测未来。
统计预测
属于预测方法研究范畴,即如何利用科学的统计方法对事物的未来发展进行定量推测。基于数学建模的预测方法种类繁多,从经典的单耗法、弹性系数法、统计分析法,
到目前的灰色预测法、机器学习
等。当在使用相应的预测方法建立预测模型时,我们需要知道主要的一些预测方法的研究特点,优缺点和适用范围。
预测类问题分为两类:一类是无法用
数学语言刻画其内部演化机理
的问题;另一类是可以通过
微分方程刻画其内部规律
,这类问题我们称为机理建模问题,通过微分方程建模求解。
如何选择合适的预测方法在预测类问题的分析中,同样受到预测条件的限制(
如数据量的大小、变量之间的关系等
)不同的预测方法可能会产生不同的结果,因此需要根据实际情况来选择。
优化类赛题
优化类问题是从所有可能方案中选择最合理的方案以达到最优目标
。在各种科学问题、工程问题、生产管理、社会经济问题中,人们总是希望在有限的资源条件下,用尽可能小的代价,获得最大的收获(比如保险)。
优化类问题一般的解题步骤为:
- (1)首先
确定决策变量
,也就是需要优化的变量;- (2)然后确定
目标函数
,也就是优化的目的;- (3)最后确定
约束条件
,决策变量在达到最优状态时,受到那些客观限制。
部分优化类赛题的解决方案
- 在08年国赛眼科病床的合理安排问题中:
- 目标函数为医院病床的利用率最高;
- 决策变量为服务策略:是先到病人先住院、急诊病人先住院还是占用病床时间短的病人先住院等;
- 约束条件可能包括病人最长等待时间限制、不同症状之间的病人不同房等;
- 在10年国赛交巡警服务平台的设置与调度问题中,
- 决策变量为服务平台的位置坐标;
- 目标函数为交巡警车到达事发地时间最短、交巡警封锁交通要道时间最短;
- 约束条件可能包括事故发生后交警最晚到达时间,一定区域内服务平台最低数量要求等。
如何选择合适的优化方法?●优化类问题中常用的数学模型和求解算法,
其中包括线性规划、非线性规划、整数规划、多目标规划
等。在模型求解中,对于凸优化模型,可以采用基于梯度的求解算法;对于非凸的优化模型,可以采用智能优化算法
。
数模各类常用算法
评价类算法
评价类算法------层次分析法
基本思想:
是定性与定量相结合的多准则决策、评价方法。将决策的有关元素分解成目标层、准则层和方案层,并通过人们的判断对决策方案的优劣进行排序 ,在此基础上进行定性和定量分析。它把人的思维过程层次化、数量化,并用数学为分析、决策、评价、预报和控制提供定量的依据。基本步骤:
构建层次结构模型;构建判断矩阵;层次单排序及一致性检验(即判断主观构建的判断矩阵在整体上是否有较好的一致性)。优点:
它完全依靠主观评价
做出方案的优劣排序,所需数据量少
,决策花费的时间很短
。从整体上看,AHP在复杂决策过程中引入定量分析,并充分利用决策者在两两比较中给出的偏好信息进行分析与决策支持,既有效地吸收了定性分析的结果,又发挥了定量分析的优势,从而使决策过程具有很强的条理性和科学性
,特别适合在社会经济系统的决策分析中使用。缺点:
用AHP进行决策主观成分很大。当决策者的判断过多地受其主观偏好影响,而产生某种对客观规律的歪曲时,AHP的结果显然就靠不住了。适用范围:
尤其适合于人的定性判断起重要作用的、对决策结果难于直接准确计量的场合。要使AHP的决策结论尽可能符合客观规律,决策者必须对所面临的问题有比较深入和全面的认识。另外,当遇到因素众多,规模较大的评价问题时,该模型容易出现问题,它要求评价者对问题的本质、包含的要素及其相互之间的逻辑关系能掌握得十分透彻,否则评价结果就不可靠和准确。改进方法:
(1)判断矩阵可以采用德尔菲法获得。
(2)如果评价指标个数过多(一般超过9个),利用层次分析法所得到的权重就有一定的偏差,继而组合评价模型的结果就不再可靠。可以根据评价对象的实际情况和特点,利用一定的方法,将各原始指标分层和归类,使得每层各类中的指标数少于9个。
评价类算法------灰色综合评价法(灰色关联度分析)
基本思想:
灰色关联分析的实质就是,可利用各方案与最优方案之间关联度大小对评价象进行比较、排序。关联度越大,说明比较序列与参考序列变化的态势越一致,反之,变化态势则相悖。由此可得出评价结果。基本步骤:
建立原始指标矩阵;确定最优指标序列;进行指标标准化或无量纲化处理;求差序列、最大差和最小差;计算关联系数;计算关联度。优点:
是一种评价具有大量未知信息的系统的有效模型,是定性分析和定量分析相结合的综合评价模型,该模型可以较好地解决评价指标难以准确量化和统计的问题,可以排除人为因素带来的影响,使评价结果更加客观准确。整个计算过程简单,通俗易懂,易于为人们所掌握;数据不必进行归一化处理,可用原始数据进行直接计算,可靠性强;评价指标体系可以根据具体情况增减;无需大量样本,只要有代表性的少量样本即可。缺点:
要求样本数据且具有时间序列特性;只是对评判对象的优劣做出鉴别,并不反映绝对水平,故基于灰色关联分析综合评价具有"相对评价"的全部缺点。适用范围:
对样本量没有严格要求,不要求服从任何分布,适合只有少量观测数据的问题;应用该种方法进行评价时,指标体系及权重分配是一个关键的题,选择的恰当与否直接影响最终评价结果。改进方法:
(1)采用组合赋权法:根据客观赋权法和主观赋权法综合而得权系数。
(2)结合TOPSIS法:不仅关注序列与正理想序列的关联度,而且关注序列与负理想序列的关联度,依据公式计算最后的关联度。
评价类算法------模糊综合评价法
基本思想:
是以模糊数学为基础,应用模糊关系合成的原理,将一些边界不清、不易定量的因素定量化,从多个因素对被评价事物隶属等级(或称为评语集)状况进行综合性评价的一种方法。综合评判对评判对象
的全体,根据所给的条件,给每个对象赋予一个非负实数评判指标,再据此排序择优。基本步骤:
确定因素集、评语集;构造模糊关系矩阵;确定指标权重;进行模糊合成和做出评价。优点:
数学模型简单,容易掌握,对多因素、多层次的复杂问题评判效果较好。模糊评价模型不仅可对评价
对象按综合分值的大小进行评价和排序,而且还可根据模糊评价集上的值按最大隶属度原则去评定对象所属的等级,结果包含的信息量丰富。评判逐对进行,对被评对象有唯一的评价值,不受被评价对象所处对象集合的影响。接近于东方人的思维习惯和描述方法,因此它更适用于对社会经济系统问题进行评价。缺点:
并不能解决评价指标间相关造成的评价信息重复问题,隶属函数的确定还没有系统的方法,而且合成的算法也有待进一步探讨。其评价过程大量运用了人的主观判断,由于各因素权重的确定带有一定的主观性,因此,总的来说,模糊综合评判是一种基于主观信息的综合评价方法。应用范围:
广泛地应用于经济管理等领域。综合评价结果的可靠性和准确性依赖于指标选取因素、因素的权重分配和综合评价的合成算子等。改进方法:
(1)采用组合赋权法:根据客观赋权法和主观赋权法综合而得权系数。
评价/预测类算法------BP神经网络
基本思想:
是一种交互式的评价方法,它可以根据用户期望的输出不断修改指标的权值,直到用户满意为止。因 此, 一般来说,人工神经网络评价方法得到的结果会更符合实际情况。优点:
神经网络具有自适应能力,能对多指标综合评价问题给出一个客观评价,这对于弱化权重确定中的人 为因素是十分有益的。
在以前的评价方法中,传统的权重设计带有很大的模糊性,同时权重确定中人 为因素影响也很大。随着时间、空间的推移,各指标对其对应题的影响程度也可能发生变化,确定的 初始权重不一定符合实际情况。再者,考虑到整个分析评价是一个复杂的非线性大系统,必须建立权 重的学习机制,这些方面正是人工神经网络的优势所在。针对综合评价建模过程中变量选取方法的局 限性,采用神经网络原理可对变量进行贡献分析,进而剔除影响不显著和不重要的因素,以建立简化 模型,可以避免主观因素对变量选取的干扰。缺点:
ANN在应用中遇到的最大问题是不能提供解析表达式,权值不能解释为一种回归系数,也不能用来 分析因果关系,目前还不能从理论上或从实际出发来解释ANN 的权值的意义。
需要大量的训练样本, 精度不高,应用范围是有限的。最大的应用障碍是评价算法的复杂性,人们只能借助计算机进行
处理,而这方面的商品化软件还不够成熟。适用范围:
神经网络评价模型具有自适应能力、可容错性,能够处理非线性、非局域性的大型复杂系统。
在 对学习样本训练中,无需考虑输入因子之间的权系数, ANN通过输入值与期望值之间的误差比较, 沿原连接权自动地进行调节和适应,因此该方法体现了因子之间的相互作用。改进方法:
(1)采用组合评价法:
对用其它评价方法得出的结果,选取一部分作为训练样本, 一部分作为待测 样本进行检验,如此对神经网络进行训练,知道满足要求为止,可得到更好的效果。
预测类算法
预测类算法------灰色预测模型
基本思想:
灰色预测是一种对含有不确定因素的系统进行预测的方法。 灰色预测通过鉴别系统因素之间发展趋势 的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律 性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。其用等时距观测 到的反映预测对象特征的一 系列数量值构造灰色预测模型,预测未来某一 时刻的特征量,或达到某一 特征量的时间。基本步骤:
1 )数据检验与处理,判断数据列的级比是否都落在可容覆盖内,从而判断已知该数据列是否可进行灰 色预测; 2 )根据预测算法建立灰色模型得到预测值; 3 )检验预测值----残差检验、级比偏差值检验; 4 )给出预测预报即结论。优点:
在处理较少的特征值数据,不需要数据的样本空间足够大,就能解诀历史数据少、序列的完整性
以及可靠性低的问题 ,能将无规律的原始数据进行生成得到规律较强的生成序列。 ● 缺点:
只适用于中短期的预测,只适合近似于指数增长的预测。适用范围:
该模型使用的不是原始数据的序列,而是生成的数据序列。核心体系是GreyModel. 即对原始数据 作累加生成 (或其他处理生成)得到近似的指数规律再进行建模的方法。
预测类算法一回归预测方法
回归预测方法是根据自变量和 因 变量之间的相关关系进行预测的。自变量的个数可以一个或多个 , 根据自变量的个数可分 为 一元 回归预测和 多元回归预测。 同时根据自变量和因 变量的相关关系 ,分为线性回归预测方法和非线性回归方法。 回 归问题的学习等价于函数拟合: 选择一条函数 曲线使其很好的拟合已知数据且能很好的预测未知数据。
优点:
1 )回归分析法在 分析多因素模型时,更加简单和方便;2 )运用回归模型,只要采用的模型和数 据相同, 通过标准的统计方法可以计算出唯一 的结果,但在图和表的形式中,数据之间关系的解 释往往因人而异, 不同分析者画出的拟合曲线很可能也是不一样的;3 )回归分析可以准确地计量 各个因素之间的相关程度与回归拟合程度的高低 ,提高预测方程式的效果;缺点:
有时候在回归分析中, 选用何种因子和该因子采用何种表达式只是一种推测,这影响了因子的多样性和 某些因子的不可测性 ,使得回归分析在某些情况下受到限制 ;适用范围:
回归分析适合 自变量和因变量之间具有一定的相关关系,并且该关系可以通过线性和非线性函数进行 拟合
预测类算法------时间序列分析法
ARIMA 模 型 的 全 称 叫 做 自 回 归 移 动 平 均 模 型 , 全 称 是 (AR IMA, Auto regressive Integrated Moving Average Model)。 也记作AR IMA (p,d,q) ,是 统计模 型 ( s t a ti s ti c model) 中 最 常见 的 一种 用 来 进行时间序列预测的模型。
建模流程:
1 )导入实验数据。 2)确定ARMA模型阶数。 3)残差检验。 4)给出结果适用范围:
根据客观事物发展的这种连续规律性,运用过去的历史数据,通过统计分析,进一 步推测市场未 来的发展趋势 。时间序列,在时间序列分析预测法处于核心位置。优点:
一般用ARMA模型拟合时间序列,预测该时间序列未来值。 Daniel检验平稳性。自动回归AR
( Auto regressive )和移动平均 MA( MovingAverage )预测模型, 预测精度相对较高,适合中长
期预测问题缺点:
当遇到外界发生较大变化,往往会有较大偏差 ,时间序列预测法对于中短期预测的效果要比长期预 测的效果好。
预测类算法------微分方程
微分 方程模型是我们在 日 常生 活 中 比较 常见 并且 比较 重要 的一种模型 ,我们在平时的课程中时经常会涉 及到这种题型 ,像比如我们所遇到的牛顿第二定律就常遇到相关的问题。
微分方程模型步骤:
- 确定实际的量(所有要求的自变量、未知函数、必要参数)并确定坐标系。
- 找出这些量所存在的基本关系(物理、化学,生物、几何等关系)。
- 运用这些关系列出方程和定解条件。 ● 优点:
是短、中、长期的预测都适合。如传染病的预测模型、经济增长 (或人口) 的预测模型、 Lan chester 战争预测模型。
缺点:
反应事物内部规律及其内在关系,但由于方程的建立是以局部规律的独立性假定为基础, 当作为长期 预测时,误差较大,且微分方程的解比较难以得到适用范围:
适用于基于相关原理的因果预测模型,大多是物理或几何方面的典型问题 ,假设条件,用数学符号表 示规律,列出方程,求解的结果就是问题的答案。
优化类算法
什么是优化类算法?
举个例子 ,假设你是一名大学生 , 怎么选择课程才能使期 末的GPA最高?
● 在这个问题中 , 决策变量是选择哪些课 , 目标函数为期末的GPA , 约 束条件为各门课程的上课时间安排、 学校的学分要求、每门课的难 易程度和自身的学习时间。
● 正常情况下 ,我们都会执行贪心的选课策略 ,在满足上课时间安排 的情况下 ,选择自己最擅长且学分较高的课程、 然后选择自己擅长 但学分不高的课程 , 最后选择剩下的课程 , 直到满足学分要求。
● 优化问题也分为单目标和多目标 ,在选课这个例子中 , 只有GPA一个目标函数 , 所以为单目 标优化问题 , 其目标函数即一个多变量单输出函数。 用xi 作为决策变量表示是否选择第i 门 课程 , 用f ( x ) 表示GPA计 算 函数。 为什 么我们会先选择擅 长且 学分 高 的课程 呢? 因为将这 些擅 长且 学分 高 的课程对应 的 决策 变量xi 设为 1会使得f ( x ) 有较大的提高 ,说明这些变量 对函数值的影响较大 ,在数学上讲 ,这些变量表示了目标函数的梯度方向。
● 沿着梯度方向迭代 , 总能到达一个函数极值点。 但是 ,极值点对应的决策变量不一定满足 约束条件。 也许你挑中了所有最擅长的课 , 结果发现这些课的上课时间是重叠的。 或者你 发现只选一门最最擅长的课可以得到最高的GPA ,但却达不到学分要求。 这些约束限制着你 的选课范围 ,也就是限制了优化方向 ,这就增加了优化问题的复杂性。
如何建立优化模型?
- 为了更直接地说明问题 ,我们先来看几个例子:
- 问题一: 某工厂在计划期内要安排生产 I、 II 两种产品 , 已知生产单位产品所需的设备 台时及A、 B 两种原材料的消耗 ,如下表所示
- ● 该工厂每生产一件产品I可获利2元 ,每生产一件产品II可获利3元。 问应如何安排计划 使该工厂获利最多?
- 所谓最优化问题是指使得问题中某 一 项指标 " 最优 " 的方案 , " 最优 " 包括: " 最 大 "、 " 最小 "、 " 最高 "、 " 最低 "、 " 最多 " 和 " 最少 " 等。
- 解决优化问题第一步需要找到目标函数 ,也就是要找到 " 最优 "; 第二步需要寻找决 策变量 ,也就是可以优化的变量 ,再通俗一点就是我们可以控制并使得目标函数更优 的变量; 第三步就是确定约束条件 ,在建模过程中比较难把握的就是约束条件 , 约束 条件需要全面准确 , 否则会产生无穷多最优解或没有最优解 , 另外约束条件往往是对 现实条件的数学刻画 ,对约束条件的合理简化也是比赛时候需要重点关注的地方。
- 在上面这个例子中 ,显然工厂利用就是目标函数 ,产品的生产计划就是决策变量 , 约 束条件为原材料消耗和生产设备的使用时长 , 因此 ,其数学模型可表示为:
- 其中 ,x 1 , x 2 表示产品1和产品2 的生产数量。
进一步 ,我们可以来总结一下优化问题的一般建模步骤: Step 1: 确定决策变量;
Step2: 用关于决策变量的函数表示目标 , 并确定是求极小还是极大; Step 3: 明确约束条件 , 并用关于决策变量的数学语言表示;
Step4: 根据变量的物理性质研究变量是否有非负性。
特别说明一下 step4 , 这是建模过程中非常容易遗忘的一个点 ,像上文例子的第四条 约束就反应了决策变量的非负性 , 因为我们知道根据物理性质 ,产品生产个数不能为 负 ,其实这条约束仍然不是很严谨 ,产品个数不仅不能为负 , 同时还应该为整数 ,第 四条约束应该为非负整数约束。
优化模型求解
简单来说 , 约束条件和目标函数都是线性的 ,称之为线性规划。
线性规划的求解可以通过ma t lab/py thon来进行求解。
当然 , 并不是所有优化模型都是线性规划 ,对于非线性无约束优化模型 ,在MAT LAB 中可以采用fm in s ea r ch 函数和fm in un c 函数进行求解。
带约束条件的优化问题比无约束条件的优化问题要复杂的多 ,种类也比较多。 对不同 类型的优化问题 ,MAT LAB提供了不同的优化方法。 其中常用的是fm in con 函数。
在无约束优化模型中,如果其目标函数为凸函数且可导,我们可以考虑通过梯度下降法求解其精确解,随机设定初始解,每次都沿梯度方向进行迭代,直到导数取值足够小。
因为梯度方向即为目标函数下降最快的方向,因此梯度下降算法求解速度很快,且精度很高,但容易陷入局部最优解,不能求解非凸问题。
牛顿迭代法利用了二阶导数信息,迭代速度比梯度下降算法更多,对于强凸函数一次迭代即可找到最优解,但每次迭代需要计算二阶Hesse矩阵,计算量相对较大。
启发式搜索算法
-
上文介绍了所有求解算法都是面向凸优化的问题,所谓凸优化问题是指目标函数为凸函数且可行域为凸集,通俗来讲,就是目标函数在可行域范围内只有一个极值点,而非凸函数在可行域内存在无数个极值点,为了跳出局部最优解,找到全局最优解,人们开始了对启发式搜索算法的研究。
-
粒子群优化算法(ParticleSwarmOptimization,简称PSO),它源于对鸟群捕食行为的研究。粒子群优化算法的基本核心是利用群体中的个体对信息的共享,从而使得整个群体的运动在问题求解空间中产生从无序到有序的演化过程,从而获得问题的最优解。
-
粒子群算法多用于决策变量为连续变量的优化问题 ,其收敛速度快 ,但其跳出局部最优解的能力相对较弱。
-
遗传算法( G en e ti c A lg o rithm )是模拟生物进化论的自然选择和遗传学机理 的生物进化过程 的 计算模型 ,是一种通过模拟自然进化过程搜索最优解的方法。 其主要用于决策变量为离散变量的 优化问题 , 比如整数规划、 0- 1规划等。 其收敛速度相对较慢 ,但跳出局部最优解的能力较强。
-
模拟退火算法脱胎于自然界的物理过程,来源于固体退火原理,是一种基于概率的算法,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。
-
模拟退火算法相对来说,对决策变量类型没有约束,不管是连续变量还是离散变量都可以进行求解,且跳出局部最优解的能力很好,容易找到全局最优解,其缺点是只能单线程作业,不能展开大范围搜索,当决策变量维度较高时,算法收敛速度很慢。