python统计分析——协方差和pearson相关系数

发布时间:2023年12月31日

参考资料:用python动手学统计学

使用数据见代码:

dic={
    "x":[18.5,18.7,19.1,19.7,21.5,21.7,21.8,22.0,23.4,23.8],
    "y":[34,39,41,38,45,41,52,44,44,49]
}
cov_data=pd.DataFrame(dic)

变量x、y的协方差Cov(x,y)的计算公式如下:

\mathrm{Cov}(x,y)=\frac{1}{N}\sum_{i=1}^{N}(x_{i}-\mu_x)(y_{i}-\mu_{y})=\frac{1}{N-1}\sum_{i=1}^{N}(x_{i}-\bar{x})(y_{i}-\bar{y})

协方差的含义:

协方差大于0:一个变量取值越大,另一个变量的取值也越大;

协方差小于0:一个变量取值越大,另一个变量的取值越小;

协方差等于0:两个变量不相关。

numpy.cov()函数可计算出x和y的协方差矩阵。

当指定ddof=0时,计算总体的协方差

当指定ddof=1时,计算样本协方差

? ? ? ?在协方差矩阵中,左上到右下的对角线上分别是x和y的标准差,左下到右上的对角线上分别是x和y的标准差。

?pearson相关系数

\rho _(x,y)=\frac{\mathrm{Cov}(x,y)}{\sigma_{x}\sigma_{y}}

python实现方法:

方法1:dataframe.corr()

方法2:series.corr()

方法3:numpy.corrcoef()

文章来源:https://blog.csdn.net/maizeman126/article/details/135318906
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。