Seaborn可视化的各种图及代码演示

发布时间:2024年01月18日

一.简介

Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。

Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。

Seaborn和Pandas的API配合的很好,使用DataFrame/Series的数据就可以绘图

二.Seaborn绘制单变量图

1.直方图

使用sns.distplot创建直方图,如下所示:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as p1t
plt.rcParams['font .sans-serif'] = ['simHei']
p1t.rcParams['axes .unicode_minus'] = False
#加载小费数据
tips = pd.read_csv('data/tips.csv')
#使用subplots函数创建画布,并在其中添加子图
fig, ax = p1t.subplots (figsize=(12,6))
sns .histplot(tips['total_bi11'],kde=True,ax=ax)
ax.set_title("总账单直方图')
p1t.show()

2. 密度图(核密度估计)

密度图是展示单变量分布的另一种方法,本质上是通过绘制每个数据点为中心的正态分布,然后消除重叠的图,使曲线下的面积为1来创建的

fig, ax = plt.subplots (figsize=(12,6))
sns.kdeplot(tips['tota1_bi11'],ax=ax)
ax.set_title("总账单KDE图')
p1t.show()

3. 计数图(条形图)

计数图和直方图很像,直方图通过对数据分组来描述分布,计数图(条形图)是对离散变量(分类变量)计数

fig, ax = lt.subplots (figsize=(12,6))
sns .countplot(data=tips ,x='day')
ax.set_title('count of days')
ax.set_xlabe1('Day of the week ')
ax.set_ylabe1('Frequency')
plt.show()

?三.Seaborn 双变量数据可视化

1.散点图

在seaborn中,创建散点图的方法有很多

fig, ax = plt.subplots (figsize=(12,6))
sns .scatterplot(x='total_bi11',y='tip',data=tips)
ax.set_title('Total Bi11 和 Tip 散点图)
ax.set_xlabel('Total Bi11')
ax.set_ylabe1('Tip')
p1t.show()

?创建散点图可以使用regplot函数。regplot不仅可以绘制散点图,还会拟合回归线,把fit_reg设置为False,将只显示散点图

fig, ax = plt.subplots (figsize=(12,6))
sns .regplot(x='total_bi11' ,y='tip',data=tips)
ax.set_title('regplot of Total Bi11 and Tip')
ax.set_xlabel('Total Bi11')
ax.set_ylabe1('Tip')
p1t.show()

?lmplot函数和regplot函数类似,也可以用于创建散点图。 lmplot函数内部会调用regplot,两者的主要区别是regplot创建坐标轴,而lmplot创建图 sns.lmplot(x='total_bill',y='tip',data = tips)

?还可以使用jointplot在每个轴上创建包含单个变量的散点图。

joint = sns.jointplot(x='total_bil1',y='tip' ,data = tips)
joint.set_axis_labels (xlabel = 'Total Bil1',ylabel='Tip')
# 添加标题,设置字号
#移动抽域上方的文宁
joint,fig.suptitle('Joint Plot of Total Bill and Tip' ,fontsize = 10,y=1.03)
p1t.show()

2. 蜂巢图

?使用Seaborn的jointplot绘制蜂巢图,和使用matplotlib的hexbin函数进行绘制

joint = sns .jointplot(x='total_bil1' ,y='tip' ,data = tips ,kind='hex')
joint.set_axis_abels (xlabel = 'Total Bi11',ylabel='Tip')
joint.fig.suptitle('Hexbin Joint Plot of Total Bill and Tip',fontsize = 10,y=1.03)
p1t.show()

3. 2D密度图

2D核密度图和kdeplot类似,但2D核密度图课展示两个变量

fig, ax = plt.subplots (figsize=(12,6))
sns .kdeplot(data=tips, x='total_bi11',y = 'tip',fil1=True)
#是否填充轮廓
ax.set_title('Kernel Density plot of Total Bill and Tip')
ax.set_xlabe1('Total Bi11')ax.set_ylabe1('Tip')
p1t.show()

?4.条形图

条形图也可以用于展现多个变量,barplot默认会计算平均值

fig,ax = p1t.subplots (figsize=(12,6))
sns.barplot(x='time' ,y='total_bil1',data=tips ,errorbar=None)
ax.set_title('Bar plot of average total bill for time of day')
ax.set_xlabel('Time of day')ax.set_ylabel('Average total bi1')
p1t.show()

5. 箱线图

箱线图用于显示多种统计信息:最小值,1/4分位,中位数,3/4分位,最大值,以及离群值(如果有)

fig, ax = 1t.subplots (figsize=(12,6))
ax = sns .boxplot(x='time' ,y='total_bi11',data = tips)
ax.set_title('Boxplot of total bil1 by time of day')
ax.set_xlabel('Time of day')
ax.set_ylabel('Total Bil1')
p1t.show()

?6.箱体图

箱线图是经典的可视化方法,但可能会掩盖数据的分布,小提琴图能显示与箱线图相同的值 小提琴图把"箱线"绘成核密度估计,有助于保留数据的更多可视化信息

p1t.subplots(figsize=(12,6))
sns .violinplot(x='time' ,y='total_bi1',data = tips)
plt.title('violin plot of total bill by time of day')
p1t.xlabe1('Time of day')
plt.ylabe1('Total Bi11')
p1t.show()

?7.成对关系

当大部分数据是数值时,可以使用pairplot函数把所有成对关系绘制出来 pairplot函数会为单变量绘制直方图,双变量绘制散点图 sns.pairplot(tips)

?pairplot的缺点是存在冗余信息,图的上半部分和下半部分相同 可以使用pairgrid手动指定图的上半部分和下半部分

pair_grid = sns.PairGrid(tips)

pair_grid.map_upper(sns.regplot)

pair_grid.map_lower(sns.kdeplot)

pair_grid.map_diag(sns.histplot)

plt.show()

?四.多变量数据

绘制多变量数据没有标准的套路 如果想在图中包含更多信息,可以使用颜色、大小和形状来区分它们

1.通过颜色区分

使用violinplot函数时,可以通过hue参数按性别(sex)给图着色 可以为“小提琴”的左右两半着不同颜色,用于区分性别

figure,ax = plt.subplots (figsize=(12,6))
sns .violinplot(x='time' ,y='total_bil1' ,hue='sex' ,data = tips ,split = True)
ax.set_title('violin plot of total bill by time of day')
ax.set_xlabe1('Time of day')
ax.set_ylabe1('Total Bi11')
p1t.show()

?其它绘图函数中也存在hue参数

scatter = sns.lmplot(x='total_bill',y='tip',data = tips,hue='sex',fit_reg = False)

2. 通过大小和形状区分

可以通过点的大小表示更多信息,但通过大小区分应谨慎使用,当大小差别不大时很难区分 在Seaborn中的lmplot,可以通过scatter_kws参数来控制散点图点的大小

scatter = sns.lmplot(x='total_bill',y='tip',data = tips,fit_reg=False,hue='sex',markers=['o','x'])

?五.主题和样式

上面的Seaborn图都采用了默认样式,可以使用sns.set_style函数更改样式。
该函数只要运行一次,后续绘图的样式都会发生变化
Seaborn有5中样式
darkgrid 黑色网格(默认)
whitegrid 白色网格
dark 黑色背景
white 白色背景
ticks 
fig,ax = plt.subplots()
ax = sns.violinplot(x='time',y='total_bill',hue='sex',data = tips,split = True)

通过set_style设置样式

sns .set_style('darkgrid')
fig,ax = p1t.subplots()
ax = sns.violinplot(x='time' ,y='total_bil1' ,hue='sex' ,data = tips ,split = True)

?

文章来源:https://blog.csdn.net/ZZ_zhenzhen/article/details/135667637
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。