利用坐标平面来探索变量之间的关系
In this tutorial, you’ll learn how to create advanced scatter plots.
本课程数据集夸克网盘下载链接:https://pan.quark.cn/s/a235ac6b2616
提取码:1Ymk使用的数据集为:insurance.csv
像往常一样,我们从设置编码环境开始。(这段代码是隐藏的,但是你可以点击右边紧挨着这段文字下面的“代码”按钮来解除隐藏。)
In [1]:
import pandas as pd
pd.plotting.register_matplotlib_converters()
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
print("Setup Complete")
Setup Complete
我们将使用一个(合成的)保险费用数据集,看看我们是否能够理解为什么一些客户比其他人支付更多。
如果您愿意,您可以在最上面的链接里找到更多的数据集进行联系。
In [2]:
# Path of the file to read
insurance_filepath = "../input/insurance.csv"
# Read the file into a variable insurance_data
insurance_data = pd.read_csv(insurance_filepath)
像往常一样,我们通过打印前五行来检查数据集是否正确加载。
In [3]:
insurance_data.head()
Out[3]:
age | sex | bmi | children | smoker |
---|