Pandas 提供了强大的字符串处理功能,这些功能类似于 Python 的标准字符串方法。你可以对 DataFrame 中的字符串数据执行各种操作,如分割、提取、计算长度等。
str.split()
分割字符串。str.get()
获取分割后的某一部分。str.len()
获取字符串的长度。# 准备数据和示例代码的运行结果,用于案例 41
# 示例数据
data_string_manipulation = {
'Names': ['Alice Smith', 'Bob Johnson', 'Charlie Brown', 'David Lee']
}
df_string_manipulation = pd.DataFrame(data_string_manipulation)
# 字符串操作
df_string_manipulation['First Name'] = df_string_manipulation['Names'].str.split().str.get(0)
df_string_manipulation['Last Name'] = df_string_manipulation['Names'].str.split().str.get(-1)
df_string_manipulation['Name Length'] = df_string_manipulation['Names'].str.len()
df_string_manipulation
在这个示例中,我们对 Names
列进行了几种字符串操作:提取第一个和最后一个单词,以及计算每个名字的长度。
Names First Name Last Name Name Length
0 Alice Smith Alice Smith 11
1 Bob Johnson Bob Johnson 11
2 Charlie Brown Charlie Brown 13
3 David Lee David Lee 9
这个结果展示了如何使用 Pandas 进行基本的字符串操作。这些技巧在数据清洗和预处理时尤其有用。