R 语言的开源、自由、免费等特点使其广泛应用于生物群落数据统计分析。生物群落数据多样而复杂,涉及众多统计分析方法。本教程以生物群落数据分析中的最常用的统计方法回归和混合效应模型、多元统计分析技术及结构方程等数量分析方法为主线,通过多个来自经典研究中的实例,详细讲述各方法的R语言实现途径(详见教学内容)。主要特点为聚焦生态学研究领域,从R语言基础操作和作图、数据准备整理,到各种数量分析方法的应用情景分析,实现从数据整理到分析结果展示的完整科学研究数据分析过程,将《R语言基础》、《tidyverse数据清洗》、《多元统计分析》、《随机森林模型》、《回归及混合效应模型》、《结构方程模型》及《统计结果作图》进行了组合(7合1)。
不仅适合R语言和生物群落(生态)数据统计分析的初学者,同样适合有高阶应用需求的研究生和科研人员。通过大量实例讲解,使大家能应对科研工作中复杂数据局面,选择合适模型,提高数据分析能力。
第一单元 R基础及数据准备
①R及Rstudio介绍:背景、软件及程序包安装、基本设置等
②R语言基本操作,包括向量、矩阵、数据框及数据列表等生成和数据提取等
③ R语言数据文件读取、整理及存储等
④R语言基础绘图(含ggplot):基本绘图、排版、发表质量绘图输出存储
①tidyvese简介:tidyr、dplyr、readr、%>%等
②文件操作:不同格式文件读取、多文件同时读取等
③数据筛选:行筛选、列筛选、条件筛选(字符操作)等
④数据生成:数据合并、数据拆分、新数据生成(字符操作)等
⑤长宽数据转换、空值(NA)等填充及删除、分组、排序及汇总等
①生物群落数据准备:物种组成、环境变量、物种功能属性、系统发育树等
②生物群落数据检查:缺失值和离群值(outliers)等-避免模型错进错出(GIGO)
③物种多样性计算:物种多样性(TD)、功能多样性(FD)和系统发育多样性(PD)
④物种相似/相异矩阵关联测度介绍
第二单元 多元统计分析
①生物群落数据非约束排序分析简介
②案例1鱼类生境数据排序:PCA
③案例2鸟类物种组成数据的排序:CA、PCoA和NMDS比较
①生物群落数据约束排序简介:非对称约束排序VS对称约束排序
②案例1景观、斑块及生境因子蛾类群落分布的解释:RDA、dbRDA或CCA选择+变差分解
③案例2物种有无(0,1)数据约束排序:dbRDA
④案例3物种组成、物种属性及环境因子的相关分析-第四角分析(4th Corner)
①生物群落数据的聚类及差异分析概述
②案例1鸟类生境数据的等级和非等级聚类:KMEANS和HCLUST
③案例2乌龟适宜生境差异检验(2组比较)及解释:PERMANOVA、MRPP、ANOSIM及Dispersion test
④案例3环境梯度下微生物组成差异分析(多组比较)及解释:MRPP及Dispersion Test
⑤案例4 药物对肠道微生物群落影响:PCoA+PERMANOVA
第三单元 机器学习
①随机森林(Random Forest)模型简介
②随机森林模型分析基本流程-分类VS回归
③案例1 随机森林分类及重要变量选择:RFM-classification
④案例2 随机森林回归模型及变量重要性评估:RFM-regression
⑤案例3 物种多维形态属性与生态属性的关联关系:PCA+PCoA+LDA+RFM综合案例
第四单元 回归及混合效应模型
①基本形式、基本假设、估计方法、参数检验、模型检验
②案例1不同鱼类游速的回归、方差及协方差分析
③案例2决定海洋植食性鱼类多样性的决定因子-模型验证
④案例3淡水鱼丰度的环境因子的筛选-逐步回归(model selection)
①广义线性混合效应模型基本原理、建模步骤及流程
②案例1有无(0,1)数据的逻辑斯蒂模型-二项分布
③案例2海豹年龄与攻击行为的关系-0,1数据转化为比率数据分析
④案例3 物种多度分布环境解释-计数数据泊松、负二项、零膨胀、零截断模型
①混合效应的基本原理及分析基本流程、步骤及实现
②案例1分层数据物种多样性决定因素-模型构建流程、模型预测及诊断
③案例2:多因素实验(分层数据)的多重比较
①广义线性混合效应模型基本原理、建模步骤及流程
②案例1蝌蚪“变态”与否(0,1)的多因素分析-逻辑斯蒂混合效应模型
③案例2虫食种子多度影响因素的多变量分析-泊松混合效应模型?
④广义线性混合效应模型分析计数数据及模型选择:泊松、伪泊松、负二项、零膨胀泊松、零膨胀负二项、零截断泊松及零截断负二项模型
①数据自相关问题简介:时间、空间和系统发育相关介绍
②案例1森林植物多样性分布格局的空间自相关修正
③案例2不同年份鸟类多度的时间自相关修正
④案例3系统发育相关在虾类多度分布分析中作用
第五单元 结构方程模型
①结构方程模型简介:定义、历史、应用、估计方法、模型可识别规则及样本量要求等
②案例1群落物种丰富度恢复的直接及间接效应(direct and indirect effects):SEM分析基本流程-lavaan vs piecwiseSEM
③案例2环境异质性和资源可获得性对不同演替阶段林下维管植物多样性的影响:模型调整、比较、评估及结果展示
④案例3人类活动、环境条件、物种属性对动物领域大小相对贡献(relative roles):混合模型、嵌套结构、分组分析及分类变量SEM实现
第六单元 统计结果作图
①群落数据及统计分析结果作图数据准备:结果提取与作图数据整理
②聚类分析及分组差异检验图:聚类结果图、热图(heatmap)、分组差异检验结果图
③PCA、CA、PCoA及NMDS等非约束排序图:排序图和双序图(biplot)
④RDA、db-RDA及CCA等约束排序图:三序图(triplot)和韦恩图(venn)
⑤回归和混合效应模型分析结果图:散点图、箱线图、柱状图及提琴图等
⑥结构方程模型结果图表达方式
注:请提前自备电脑及安装所需软件
包含Python机器学习、数据挖掘、PyTorch机器学习、MATLAB机器学习、R语言【Tidyverse、Tidymodel】、地理加权回归、结构方程模型、贝叶斯网络模型、混合效应(多水平层次嵌套)模型、Copula变量相关性、极值统计学、分位数回归、InVEST模型、PLUS模型、DNDC模型、APSIM模型、DSSAT模型、MAXENT模型、CENTURY模型、CASA模型、BGC模型、CLM模式、CESM模式、CLUE模型、FLUS模型、PROSAIL模型、Meta分析、BIOMOD2模型、物种气候生态位、物候提取、Python地球科学、Noah-MP陆面过程模型、CLUE模型、Fragstats景观格局分析、GEE遥感云大数据、Matlab/Python高光谱遥感、DICE模型、LEAP模型、双碳、ArcGIS、ArcGIS Pro等...
★关 注【科研充电吧】公 众 号,获取海量教程和资源
ChatGPT发布一周年,我再也离不开它了!!还有人不会用??你都在什么时候用到ChatGPT-CSDN博客文章浏览阅读60次。1.熟练掌握ChatGPT提示词技巧及各种应用方法,并成为工作中的助手;2.通过案例掌握ChatGPT撰写、修改论文及工作报告,提供写作能力及优化工作;3.熟练掌握ChatGPT融合相关插件的应用,完成数据分析、编程以及深度学习等相关科研项目;4.掌握各种AI绘图工具,随意生成各类型性图像;5.总结关注问题,进行辅助指导及交流。https://blog.csdn.net/WangYan2022/article/details/134826035?spm=1001.2014.3001.55022024年申报国自然项目基金撰写及技巧丨技术路线图如何设计才能吸引评阅专家的目光?如何区分难点问题和关键科学问题?每个章节突出哪些内容才能让项目书更加清晰明了?-CSDN博客文章浏览阅读428次,点赞15次,收藏6次。基金项目申请在新时期更加注重国际化视野。申请人需要关注国际前沿研究动态,积极参与国际合作项目,并能够充分展示项目对国际学术和科技发展的贡献。尤其是青年学者,工作繁重、资源溃泛、基金申请缺乏经验、同时没有形成高效研究团队,仅凭一己之力,在竞争激烈的当下显然不具备优势条件。基金申请是每年学者重要工作内容,势必要时间与精力投入,但往往是在提交前,集中一个有限的时间进行撰写,结果事与愿违。https://blog.csdn.net/WangYan2022/article/details/135067259?spm=1001.2014.3001.5502文献计量学方法与应用、主题确定、检索与数据采集、VOSviewer可视化绘图、Citespace可视化绘图、R语言文献计量学绘图分析-CSDN博客文章浏览阅读1.3k次,点赞25次,收藏24次。Citespace和vosviewer是使用最广泛的文献信息可视化软件工具,在理工、经管、法学、教育、农学、文史、医学、艺术等学科中普遍应用,发文量逐年显著上升。https://blog.csdn.net/weixin_46747075/article/details/134870335?spm=1001.2014.3001.5502