Pandas 提供了丰富的字符串操作功能,这些功能很大程度上类似于 Python 原生的字符串方法。你可以对 DataFrame 或 Series 中的字符串进行分割、转换、替换等操作。这些操作在处理文本数据时非常有用。
split
方法分割字符串。upper
方法将字符串转换为大写。# 重新导入 pandas 并准备数据和示例代码的运行结果,用于案例 16
import pandas as pd
# 示例数据
data_string_operations = {
'Name': ['Alice Smith', 'Bob Johnson', 'Carol Williams', 'David Brown']
}
df_string_operations = pd.DataFrame(data_string_operations)
# 字符串操作:分割名字和姓氏
df_string_operations['FirstName'] = df_string_operations['Name'].apply(lambda x: x.split()[0])
df_string_operations['LastName'] = df_string_operations['Name'].apply(lambda x: x.split()[1])
# 字符串操作:全部转换为大写
df_string_operations['Name_Upper'] = df_string_operations['Name'].str.upper()
df_string_operations
在这个示例中,我们有一个包含人名的 DataFrame。我们使用 apply
方法和字符串的 split
方法将名字分割为名和姓,然后将整个名字转换为大写。
Name FirstName LastName Name_Upper
0 Alice Smith Alice Smith ALICE SMITH
1 Bob Johnson Bob Johnson BOB JOHNSON
2 Carol Williams Carol Williams CAROL WILLIAMS
3 David Brown David Brown DAVID BROWN
这个结果展示了分割后的名字和姓氏,以及转换为大写的全名。字符串操作是数据清洗和预处理中常见且重要的步骤。