Pearson correlation coefficient (Pearson’s r) 皮尔森相关系数

发布时间：2023年12月31日

此图用的是箱状图，的纵轴是“Pearson’s r”，是实际观测值与机器学习模型预测值之间的相关性

Pearson's f得分，它是一个统计量，用来衡量两个变量之间线性相关性的强度。这个得分可能是用来衡量实际观测值与机器学习模型预测值之间的相关性。

Pearson's f得分的范围从-1到1：

一个接近1的得分表示一个非常强的正相关性，意味着模型的预测值随着观测值的增加而增加。
一个接近-1的得分则表示一个非常强的负相关性，即模型的预测值随着观测值的增加而减少。
一个接近0的得分表示几乎没有或没有线性相关性。

得分越接近1，表示模型的预测准确度越高。

对于上图来说：

他这个中位线在箱子靠上或者靠下的位置是什么含义？

对于Pearson's r来说，由于它是衡量正相关性的指标，箱线图中的中位数线位置（无论靠上还是靠下）并不直接反映偏态，而是反映在一系列测试中模型预测与实际值相关性的一致性和准确性的中间值。简单来说，中位数线越靠近1.00，表示模型预测与实际值的相关性越强，性能越好。中位数线的位置在箱体内上方或下方，主要说明了数据的分布情况，而不是偏态。在这个特定的上下文中，我们关心的是中位数线与1.00这个完全正相关的值有多接近，而不是它在箱体内的相对位置。

文章来源:https://blog.csdn.net/weixin_43135178/article/details/135316858
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！