python统计分析——直方图(df.hist)

发布时间:2024年01月05日

使用dataframe.hist()或series.hist()函数绘制直方图

import numpy as np
import pandas as pd
from matplotlib import pyplot as plt.

df=pd.DataFrame(data={
    'type':['A','A','A','A','A','A','A','A','A','A','B','B','B','B','B','B','B','B','B','B'],
    'value':[2,3,3,4,4,4,4,5,5,6,5,6,6,7,7,7,7,8,8,9]
})
ser=pd.Series(data=[2,3,3,4,4,4,4,5,5,6])

?

1、下面先介绍series.hist()函数中常用的几个重要参数(参数等号后为默认设置):

(1)by=None, 用于对数据进行分组,结构需要与数据源的结构一致。
(2)ax=None, 表示要引用的坐标系,当设置了多个坐标系时可以指定具体的坐标系。
(3)grid: 'bool' = True, 用于设置网格线,下图为grid=False的情况。

(4)bins: 'int | Sequence[int]' = 10, 设置数据桶的数目。

2、下面先介绍dataframe.hist()函数中常用的几个重要参数(参数等号后为默认设置):

(1)column: 'IndexLabel' = None, 用于指定需要作图的数据列。本例中只有一个数据列,故无需指定。
(2)by=None, 用于指定需要分组的列。

(3)grid: 'bool' = True, 用于设置网格线是否显示。
(4)sharex: 'bool' = False, sharey: 'bool' = False, 用于设置多个图是否共用x轴/y轴坐标系。
(5)layout: 'tuple[int, int] | None' = None, 用于设置多个图的布局。下图将布局设置为2行1列的形式。

(6)bins: 'int | Sequence[int]' = 10,用于设置数据桶的数目。
文章来源:https://blog.csdn.net/maizeman126/article/details/135366924
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。