2、机器学习基础数据探索

发布时间:2024年01月17日

加载并理解您的数据。

本课程所需数据集夸克网盘下载链接:https://pan.quark.cn/s/9b4e9a1246b2
提取码:uDzP

1、使用Pandas了解你的数据

任何机器学习项目的第一步都是熟悉数据。您将使用Pandas库进行此操作。Pandas是数据科学家用来探索和操纵数据的主要工具。大多数人在代码中将panda缩写为pd

In [1]:

import pandas as pd

Pandas库中最重要的部分是DataFrame。DataFrame包含您可能认为是表的数据类型。这类似于Excel中的工作表或SQL数据库中的表。

Pandas有强大的方法来处理你想用这种类型的数据做的大多数事情。

举个例子,我们来看看澳大利亚墨尔本的房价数据。在实践练习中,您将把同样的过程应用于一个新的数据集,该数据集包含爱荷华州的房价。

示例(墨尔本)数据位于文件路径melbourne housing snapshot/melb_data.csv

我们使用以下命令加载和浏览数据:

In [2]:

文章来源:https://blog.csdn.net/jiangxinufo00/article/details/135640845
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。