加载并理解您的数据。
本课程所需数据集夸克网盘下载链接:https://pan.quark.cn/s/9b4e9a1246b2
提取码:uDzP
任何机器学习项目的第一步都是熟悉数据。您将使用Pandas库进行此操作。Pandas是数据科学家用来探索和操纵数据的主要工具。大多数人在代码中将panda缩写为pd
In [1]:
import pandas as pd
Pandas库中最重要的部分是DataFrame。DataFrame包含您可能认为是表的数据类型。这类似于Excel中的工作表或SQL数据库中的表。
Pandas有强大的方法来处理你想用这种类型的数据做的大多数事情。
举个例子,我们来看看澳大利亚墨尔本的房价数据。在实践练习中,您将把同样的过程应用于一个新的数据集,该数据集包含爱荷华州的房价。
示例(墨尔本)数据位于文件路径melbourne housing snapshot/melb_data.csv
。
我们使用以下命令加载和浏览数据:
In [2]: