在数据处理中,将分类数据转换为数值编码是常见的做法,尤其是在准备机器学习模型时。Pandas 提供了将分类数据转换为数值编码的方法。
.astype('category')
将列转换为分类数据类型,然后使用 .cat.codes
获取每个类别的数值编码。# 准备数据和示例代码的运行结果,用于案例 60
# 示例数据
data_categorical_encoding = {
'Category': ['A', 'B', 'C', 'A', 'B', 'C']
}
df_categorical_encoding = pd.DataFrame(data_categorical_encoding)
# 对分类数据进行编码
df_categorical_encoding['Encoded'] = df_categorical_encoding['Category'].astype('category').cat.codes
df_categorical_encoding
在这个示例中,我们将 Category
列转换为分类数据类型,并为每个类别分配了一个唯一的数值编码。
Category Encoded
0 A 0
1 B 1
2 C 2
3 A 0
4 B 1
5 C 2
这个结果显示了原始分类数据及其对应的数值编码。这种编码技术在处理分类特征时非常有用,尤其是在数据需要用于机器学习算法时。
请告诉我是否继续下一个案例。