RStudio面板展示

配套代码
#线性回归分析
women #查看women 数据集
plot (women$height,women$weight) #绘制第一次高度与重量之间的散点图
?lm #线性回归模型
fit <-lm(weight ~ height,data = women ) #定义结果fit,意味合适的
summary(fit) #查看结果
#结果分析
#Call:列出结果使用的公式
#Residuals:残差,指真实值与预测值之间的差,残差值越小越精确
#Coefficients:系数项 Intercept:截距
#关系式为:weighe=3.45*Height-87.52
#Pr就是PValue,Signif. codes指系数为零假设成立的概率,一般Pr小于0.05假设才认为成立
#Residual standard error:残差标准物,误差越小越好
#Multiple R-squared: R方判定系数,衡量模型拟合质量的指标,取值在0-1之间,值越大越好,这个模型能解释数据的比例,这里能解释百分之九十九点一的数据
#F-statistic: F统计量,用来说明模型是否显著,也是用PValue来表示
#常营函数
coefficients(fit) #列出截距和比例系数
confint(fit) #列出置信区间,默认为百分之九十五的置信区间
confint(fit,level=0.5) #可以用level进行调整
fitted(fit) #列出预测值
women$weight-fitted(fit) #列出残差,与预测值进行比较
residuals(fit) #利用函数直接输残差值
women1 <- women #假设新的数据集
predict(fit,women) #根据拟合结果对新的数据集进行预测
plot(fit) #对拟合结果进行绘图,会生成4幅图,残差拟合图,正态QQ图,大小位列图,残差影响图
plot (women$height,women$weight) #绘制高度与重量之间的散点图
abline(fit) #绘制出拟合曲线
#利用多次项线性回归预测身高与体重的关系
fit2 <- lm(weight ~ height + I(height^2), data = women ) #定义fit2,增加一个二次项
fit2 #查看fit2
summary(fit2) #查看fit2结果
plot(women$height,women$weight) #绘制第一次高度与重量之间的散点图
abline(fit) #绘制第一次拟合曲线
lines (women$height,fitted(fit2),col="red") #绘制第二次高度与重量之间的散点图
fit3 <- lm(weight ~ height+ I (height^2) + I(height^3), data = women ) #定义fit2,增加一个二次项
fit3 #查看fit2
summary(fit3) #查看fit2结果
plot(women$height,women$weight) #绘制第一次高度与重量之间的散点图
abline(fit) #绘制第一次拟合曲线
lines (women$height,fitted(fit2),col="red") #绘制第二次高度与重量之间的散点图
lines (women$height,fitted(fit3),col="blue") #绘制第三次高度与重量之间的散点图
?最终效果图:多次项线性回归预测身高与体重的关系
