使用须知:该论文为直接可以提交的论文,会进行展示。很多人都会这一版本成品论文,直接提交一定会查重不过关。成品论文是按着半成品论文以及之前的解题思路写出的,如果不对外展示,在普通建模竞赛是可以直接提交100%获奖的文章,保二冲一的水平。进行展示的目的,及为了让辅助大家写论文,也让大家知道获奖的话应该要比展示的这篇成品论文要更好一些。
组委会要求重要格式规范如下所示,大家可以根据要求,以及1资料中提供的优秀论文资料进行修改。以下是研赛论文要求,请认真阅读!!
5.1.4基于LSTM的时间序列预测模型
长短时记忆网络即LSTM网络,它是一种递归神经网络。与其他的神经网络相比,这种网络最大的不同之处就是所有的隐藏层单元并不是彼此独立存在的。各大隐藏层间不仅有密切的联系,隐藏层单元前节点的时序输入与之有非常密切的关系,该特征在处理和时序关联的数据会产生极大的影响。LSTM神经网络可以记住长期依赖关系可以克服处理长序列的数据时发生的梯度爆炸和梯度消失等问题。
LSTM的结构单元如图10所示,主要包括:输入门、输出门、遗忘门和自连接的记忆单元状态值。LSTM模型中三类门结构的核心功能即管控传递,控制何种信息可以传递至当前神经元,选择多少当前神经元的信息至下一个神经元,其取值主要取决于
5.1.5 LSTM的时间序列预测结果
5.1.6 多元回归模型的预测结果
可以用多元回归作为对比,比如OLS回归
OLS线性回归是一种常见的统计方法,用于拟合线性关系模型,通过最小化残差平方和进行回归。建立一个线性回归模型,通常表示为:
5.2问题二模型的建立与求解
5.2.1基于皮尔逊系数相关性分析的降维模型
我们将上述数据类别均作为指标,将总发电量作为关键指标放入进行分析,通过必对相关性系数的值进行指标选择。
首先,我们对已有数据进行处理,计算出发电总量。
先对各个指标进行相关性分析,为了分析多个影响因素与因变量之间的重要程度关系,采用皮尔逊相关性分析方法,如式(1)所示。通过计算多个影响因素和因变量的协方差来衡量二者之间的线性相关程度,得到皮尔逊相关系数
。皮尔逊相关系数的取值范围在-1到1之间,
越接近1表示正相关性越强,越接近-1表示负相关性越强。借助皮尔逊相关性分析方法,可以深入了解所选取的影响因素与决策标签之间的线性相关关系。
根据皮尔逊相关性绘制的热力图如图2所示,可知多个自变量与因变量综合得分的相关系数类似,由此采用因子分析降维,与因变量因子分析步骤相同,分别进行单因子,双因子、三因子,得双因子结果最好。为节省篇幅只展示双因子结果,如图3所示。即聚合为五个自变量主因子。