如何统计csv文件中对象的数量(基于pandas)

发布时间:2024年01月04日

前言

在脚本的编写过程中,常常需要对在csv文件中的某些对象进行统计,从而满足业务进一步地需求,本篇博客就通过分享一个实例来跟大家介绍如何使用python的pandas库对csv中的指定的对象进行统计

任务介绍

csv文件中的‘type’字段中,存在不同的维度类别,现在需要对不同的维度类别的数量进行统计

代码实现

读取csv文件的数据

import pandas as pd
from collections import defaultdict

data_path = r"你的csv文件路径"
data = pd.read_csv(data_path)

初始化默认值为int类型的字典数据类型进行数据的统计

industry_dict = defaultdict(int)
for i,row in data.iterrows():
    industry_dict[row['type']] += 1

我们就得到了以csv文件中type字段的值作为主键,对应出现次数作为值的industry_dict字典

按格式打印出来看看

for k,v in industry_dict.items():
    print(k, v)
成分/原料/材质 6983
人群 1005
场景 1057
病症/体质 691
包装 278
包装外形 282
颜色 1499
科技/工艺 469
包装设计 1112
性格/设计/形态 345
功效 775
气味/味道 1452
风味 490
包装材质 214
触感/口感/体验 354

从结果可以看出,已经完成统计的任务

欢迎大家讨论交流~


文章来源:https://blog.csdn.net/weixin_57506268/article/details/135327089
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。