Python数据分析:活用Pandas库

发布时间:2024年01月24日

Pandas是Python中最常用的数据分析库之一。它提供了高效的数据结构,如DataFrame和Series,以及许多用于数据处理和分析的函数和方法。下面是一些常见的Pandas库的用法和示例代码说明:

1.导入Pandas库:

import pandas as pd

2.创建DataFrame:

data = {'Name': ['Tom', 'Jack', 'Steve', 'Ricky'],
        'Age': [28, 34, 29, 42],
        'Salary': [2500, 5000, 3500, 6000]}
df = pd.DataFrame(data)
print(df)

输出结果:

   Name  Age  Salary
0   Tom   28    2500
1  Jack   34    5000
2  Steve  29    3500
3  Ricky  42    6000

3.读取和写入数据文件:

# 读取CSV文件
df = pd.read_csv('data.csv')

# 写入CSV文件
df.to_csv('output.csv', index=False)

4.数据清洗和预处理:

# 删除缺失值
df.dropna()

# 填充缺失值
df.fillna(0)

# 删除重复值
df.drop_duplicates()

5.数据选择和过滤:

# 选择单列
df['Name']

# 选择多列
df[['Name', 'Salary']]

# 选择行
df.iloc[0]  # 选择第一行
df.loc[df['Age'] > 30]  # 选择年龄大于30的行

6.数据排序:

# 按指定列排序
df.sort_values('Age')

# 按指定列降序排序
df.sort_values('Salary', ascending=False)

# 按多列排序
df.sort_values(['Age', 'Salary'], ascending=[True, False])

7.数据聚合和分组:

# 计算平均值
df['Salary'].mean()

# 按列分组并计算平均值
df.groupby('Name')['Salary'].mean()

这些是使用Pandas库进行数据分析的一些常见操作和示例代码。Pandas还提供了许多其他有用的函数和方法,可以根据具体的数据分析任务进行进一步学习和探索。

文章来源:https://blog.csdn.net/xukris/article/details/135814500
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。