在脚本的编写过程中,常常需要对在csv文件中的某些对象进行统计,从而满足业务进一步地需求,本篇博客就通过分享一个实例来跟大家介绍如何使用python的pandas库对csv中的指定的对象进行统计
csv文件中的‘type’字段中,存在不同的维度类别,现在需要对不同的维度类别的数量进行统计
读取csv文件的数据
import pandas as pd
from collections import defaultdict
data_path = r"你的csv文件路径"
data = pd.read_csv(data_path)
初始化默认值为int类型的字典数据类型进行数据的统计
industry_dict = defaultdict(int)
for i,row in data.iterrows():
industry_dict[row['type']] += 1
我们就得到了以csv文件中type字段的值作为主键,对应出现次数作为值的industry_dict字典
按格式打印出来看看
for k,v in industry_dict.items():
print(k, v)
成分/原料/材质 6983
人群 1005
场景 1057
病症/体质 691
包装 278
包装外形 282
颜色 1499
科技/工艺 469
包装设计 1112
性格/设计/形态 345
功效 775
气味/味道 1452
风味 490
包装材质 214
触感/口感/体验 354
从结果可以看出,已经完成统计的任务
欢迎大家讨论交流~