如何统计csv文件中对象的数量（基于pandas）

发布时间：2024年01月04日

前言

在脚本的编写过程中，常常需要对在csv文件中的某些对象进行统计，从而满足业务进一步地需求，本篇博客就通过分享一个实例来跟大家介绍如何使用python的pandas库对csv中的指定的对象进行统计

任务介绍

csv文件中的‘type’字段中，存在不同的维度类别，现在需要对不同的维度类别的数量进行统计

代码实现

读取csv文件的数据

import pandas as pd
from collections import defaultdict

data_path = r"你的csv文件路径"
data = pd.read_csv(data_path)

初始化默认值为int类型的字典数据类型进行数据的统计

industry_dict = defaultdict(int)
for i,row in data.iterrows():
    industry_dict[row['type']] += 1

我们就得到了以csv文件中type字段的值作为主键，对应出现次数作为值的industry_dict字典

按格式打印出来看看

for k,v in industry_dict.items():
    print(k, v)

成分/原料/材质 6983
人群 1005
场景 1057
病症/体质 691
包装 278
包装外形 282
颜色 1499
科技/工艺 469
包装设计 1112
性格/设计/形态 345
功效 775
气味/味道 1452
风味 490
包装材质 214
触感/口感/体验 354

从结果可以看出，已经完成统计的任务

欢迎大家讨论交流~

文章来源:https://blog.csdn.net/weixin_57506268/article/details/135327089
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！