python统计分析——多变量描述统计

发布时间:2023年12月28日

资料来源:用Python动手学统计学

多变量的描述统计,通常利用pandas的groupby函数将数据进行分组处理,然后再计算各统计量。

0、导入库和原始数据

import numpy as np
import pandas as pd
import scipy as sp

data_set=pd.DataFrame(
    {"type":['A','A','A','B','B','B'],
     "data":[2,3,4,6,8,10]}
)

1、利用groupby函数对数据进行分组

group=data_set.groupby('type')
type(group)

现在group变量已经按照type对数据进行分组,后面对group进行统计处理,即可获得不同type的统计量。

2、平均数

group.mean()

3、标准差

group.std(ddof=1),ddof的用法参照:python统计分析——单变量描述统计-CSDN博客

4、最大值和最小值

最大值:group.max()

最小值:group.min()

5、计数

group.count()

6、求和

group.sum()

7、中位数

group.median()

8、四分位数

下四分位数:group.quantile(q=0.25)

上四分位数:group.quantile(q=0.75)

9、一次性获取计数、均值、标准差、极值、四分位数、中位数

group.describe()

文章来源:https://blog.csdn.net/maizeman126/article/details/135274344
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。