在互联网+的大数据时代背景下,电子商务经济飞速发展,吸引着主流消费群体向互联网消费转移。各大高校传统电商专业结合大数据,选择开设“商务数据分析”专业及课程来培养相关专业人才,电商相关领域数据采集与处理变成了必不可少的环节。
如何将繁杂的电商信息可视化、数据化输出用以分析研究,即拥有电商大数据能力,成为当今的热门需求。作为电商行业中的分支,网络购物交易占据了重要比例,因此我们以京东平台为例,讲解如何简易快速的获取京东商品列表信息数据并导出。
京东电商平台
京东是中国的综合网络零售商,是中国电子商务领域受消费者欢迎和具有影响力的电子商务网站之一,京东电商平台主要涵盖商品信息及商品评论信息。电商数据源应用研究较为广泛,主要可用于包括预测流行趋势,消费趋势、地域消费特点、客户消费习惯、各种消费行为的相关度、消费热点、影响消费的重要因素等。
采集任务描述
在京东搜索页https://www.jd.com/,输入关键词并搜索,采集搜索后得到的多个商品列表页数据。采集品牌名称、商品价格、商品评论数、商品名称、店铺链接,最后导出为Excel格式。
采集规则设置
采集共分为以下四个步骤。
Step 01、确认采集网站。
确认采集网站主要是确认最终想采集的数据所在的网址链接,八爪鱼支持多网站链接采集,本次以耐克(Nike)品牌产品为例,在京东网站搜索“耐克”获取此时网址。
Step 02、设置采集任务
Step 03、设置规则
1、首先创建翻页【循环】,保证能采集到后续翻页的内容;
2、其次建立商品【循环】,保证能采集到每个商品中的信息;然后可自由编辑字段;
Step 04、数据采集
1、规则运行,执行采集任务并导出数据。
2、查看Excel中数据部分
根据以上规则设置即可快速完整采集京东平台商品列表页数据。批量化整理指定商品的价格及店铺信息,方便后续电商数据的分析应用。本案例只做京东商品列表数据信息采集操作演示,字段,采集关键词等均可自由调整,欢迎尝试探索。