2024华数杯国际赛B题ICM完整数据模型解题求解分享 保姆级手把手教学

发布时间:2024年01月17日

背景
·中国的电力组成:包括传统能源(煤炭、石油、天然气)、可再生能源(水力、风能、太阳能、核能)等形式。

·中国的发电量:超过20万亿千瓦时,全球领先。

·向可再生能源转型:强调减少对传统能源的依赖,增加可再生能源的比例,提高能效,创新清洁能源技术。

·光伏发电:重要的可再生能源之一。效率变化大,面临成本、稳定性、可靠性、环境问题及与国家战略的融合等技术挑战。

问题要求
1.电力供应与发展趋势(2024-2060年):研究影响中国电力供应的各种因素及其发展趋势。

2.建设光伏电站的可行性:考虑地理位置、光照条件和成本效益分析,评估选定地区的可行性。

3.中国光伏发电潜力:考虑地理资源、投资能力和成本收益因素,估算最大潜力。

4.可持续发展的战略规划:分析用清洁能源(光伏电力)替代燃煤电力是否有助于实现2060年碳中和目标。

5.给中国政府的信:基于研究结果,起草一页纸的信件。

数据来源

问题一

各类型电力资源产量:数据来源国家统计局

电力投入数据:数据来源国家统计局

电力消费数据:数据来源国家统计局

电力相关系数:数据来源国家统计局

进出口数据来源于海关总署

中国发展宏观指标

问题二问题三:

县级居住地:中国科学院资源环境科学与数据中心

主要公路铁路网:中国科学院资源环境科学与数据中心

DEM:中国科学院资源环境科学与数据中心

土地利用类型:中国科学院资源环境科学与数据中心

归一化植被指数:中国科学院资源环境科学与数据中心

保护区:中国科学院资源环境科学与数据中心

保护地:世界保护区数据库(https://www.protectedplanet.net/country/CHN)

总水平辐射:Solargis(https://solargis.com/en )

问题四:(2023长三角赛题 2023 年研赛 D 题)

历年不同行业碳排放数据

碳排放因子库

具体建模分析:

在这里插入图片描述

问题一方法一:使用ARIMA(自回归积分滑动平均)模型,这是一个常用于时间序列数据预测的模型,特别是数据中存在线性趋势和季节性的时候。

首先,我们需要分析数据,了解总发电量和非化石能源发电量的趋势。接着,我们可以使用已有的数据来训练模型,并预测未来的值。我们还应该检查模型的假设是否得到满足,例如残差的正态性和方差齐性。

下面,我们将使用Python中的statsmodels库来尝试建立ARIMA模型,并基于现有数据进行预测。

具体的步骤如下:

1.数据准备:

收集数据,并将其转换为时间序列格式。确保数据没有缺失值,并且是按时间顺序排列的。

2.探索性数据分析:绘制时间序列图,查看数据的整体趋势和季节性。使用自相关图(ACF)和偏自相关图(PACF)来初步判断可能适合的ARIMA模型参数。

3.平稳性检验:使用单位根检验(如ADF检验)来判断时间序列是否平稳。如果时间序列非平稳,进行差分操作直到序列平稳。

4.模型识别:根据ACF和PACF图,识别ARIMA模型的参数(p, d, q)。p是自回归项的数量,d是差分阶数,q是移动平均项的数量。

5.模型估计和拟合:使用最大似然估计或其他技术来估计模型参数。拟合模型并检查模型的残差是否呈白噪声。

6.模型诊断:检查残差的自相关性以确保模型良好拟合数据。可以使用残差的ACF图,以及Ljung-Box检验来检验残差序列的随机性。

7.模型选择:比较不同模型的信息准则,如AIC(赤池信息准则)或BIC(贝叶斯信息准则)。选择AIC或BIC值最小的模型。

8.模型验证:将数据集分为训练集和测试集。在训练集上拟合模型,在测试集上验证模型的预测性能。计算预测误差的度量,如均方误差(MSE)或均方根误差(RMSE)。

9.预测:使用整个数据集重新拟合模型。进行未来时间点的预测,并给出预测的置信区间。

10.模型检验:检验模型的稳定性,观察参数是否在合理范围内;检验残差序列是否无自相关性、无趋势和常数方差。

每一步中都可能需要迭代优化,例如在模型识别阶段可能需要尝试多个不同的参数组合,然后基于模型诊断的结果回过头来调整模型参数。ARIMA模型的构建是一个迭代的过程,需要不断地通过诊断结果来优化模型。

问题一方法二:ARIMA模型的修正

对模型进行季节性调整,即使用SARIMA模型,或者对非线性序列使用ARIMA模型的扩展,比如ARCH/GARCH模型处理异方差性,或者对含有非线性趋势的数据使用指数平滑模型等。

本题将采用SARIMA模型这一修正模型

在这里插入图片描述

问题二和问题三:
在这里插入图片描述

问题二:建设光伏电站的可行性:考虑地理位置、光照条件和成本效益分析,评估选定地区的可行性。

问题三:中国光伏发电潜力:考虑地理资源、投资能力和成本收益因素,估算最大潜力。

建模思路概括版:考虑构建多维度指标体系,并对其分层分类。

构建层次分析法进行求解。即为问题二的求解结果。

问题三将在问题二的基础上对不同地区不同状态下的光伏发电站构建公式计算其发电效率,从而得到发电潜力。

详细建模:
在这里插入图片描述

需要考虑的因素

  1. 地理因素:保护区、距保护地距离、坡的朝向、坡度大小、土地利用类型和

归一化植被指数

  1. 光照条件:太阳总水平辐射量

  2. 成本效益:初期建设成本和后期维护成本(距县城的距离、距公路铁路网距

离)

建设光伏电站时需考虑环境保护,选址时尽量选择离保护区和保护地较远的区域;

太阳总水平辐射量是进行光伏电站选址的主要因素,需着重考虑;坡向与坡度均会影响光伏电站的选址,其中坡度较小,坡向朝阳的缓坡适宜建设光伏电站;有些土地利用类型并不适宜建设光伏电站,如:建筑用地、农业用地、商业用地等;归一化植被指数是指近红外波段与可见光红光波段的亮度之差与之和的比值,归一化植被指数可反映该地区的植被覆盖率。归一化植被指数较大的区域也不适宜建设光伏电站。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

光伏发电潜力精确预测,是对太阳能资源进行规划的前提。通过年平均总水平辐

照量(GHR)、光伏组件面积和光伏组件利用系数计算得到光伏的发电潜力,

如下面公式所示:

光伏组件的利用系数可通过光伏组件的转化系数和电气系数计算得到,即

光伏系统的发电效率与光伏组件选型有关,光伏组件主要有:单晶硅组件、多晶硅组件和非晶硅组件,其中单晶硅组件的转换效率为 18%~25%,多晶硅组件的转换效率为 15%~20%,非晶硅组件的转换效率为 7%~12%,而光伏电站的电 气效率约为 80%。由于,单晶硅组件相较于其他光伏组件而言具有光电转化效率高、可靠性高等优点,因此,目前市场上主流的光伏组件为单晶硅光伏组件。本文以单晶硅光伏组件为例,取光伏组件的换效率为 20%,电气效率为 80%。

通过土地面积、坡向利用系数、坡度利用系数、土地类型利用系数、有效面积系 数计算得到光伏组件面积

利用上述三个公式进行多因子叠加分析,对中国范围内进行光伏发电潜力评估,

最终得到下图

问题四基于问题一预测得到的不同发电方式的占比结果和未来中国发电能力情况进行计算,主要考虑基于不同类型行业的碳排放数据、碳中和政策,基于碳排放因子库对数据进行计算。

详细内容:docs.qq.com/doc/DVUdXWUJyT0JYWFNR
文章来源:https://blog.csdn.net/yeqianqian_/article/details/135654280
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。