目录
有任何学习问题可以加我微信交流哦!bmt1014
一、项目简介
(一)项目背景 1
(二)项目过程 1
二、项目设计流程图 3
(一)基于Python数据可视化的网易云音乐歌单分析系统的整体架构 3
(二)获取歌单索引页的信息 4
(三)获取歌单详情页的信息 5
(四)歌曲出现次数 TOP10 6
(五)网易云音乐欧美歌单播放 TOP10 6
(六)网易云音乐欧美歌单评论 TOP10 7
(七)欧美歌单播放数量分布情况 7
(八)网易云音乐欧美歌单标签图 8
(九)歌单介绍词云图 8
三、项目实现代码 (代码太长,没放)
(一)netease_cloud_music_data_analysis.py 9
(二)music_index.py 11
(三)music_detail.py 13
(四)top_10_song.py 15
(五)top_10_ea_song_playlists.py 17
(六)top_10_of_ea_song_collection.py 19
(七)top_10_of_ea_song_comment.py 21
(八)top_10_ea_song_collection_distribution.py 23
(九)top_10_ea_song_playlists_distribution.py 25
(十)label_ea_song.py 26
(十一)music_wordcloud.py 28
四、项目分析结果 30
(一)歌曲出现次数 TOP10 31
(二)网易云音乐欧美歌单播放 TOP10 32
(三)网易云音乐欧美歌单评论 TOP10 32
(四)欧美歌单播放数量分布情况 33
(五)网易云音乐欧美歌单标签图 34
(六)歌单介绍词云图 35
(七)音乐歌单运营分析 35
(八)歌单数据可视化的商业价值 37
随着音乐软件的普及,海量的相关数据被创造。在大数据的时代,任何大量的数据一旦被利用起来,将会产生巨大的价值。利用 Python 分析歌曲的相关数据来挖掘客户的需求并更进一步的扩大用户量的例子比比皆是。
考虑到现实的可操作性以及 Python 在数据分析和交互、探索性计算以及数据可视化等方面都有非常成熟的库。且经过小组测试可行性,决定利用 Python 对音乐软件歌单进行分析。
此次项目利用 Python 对网易云音乐歌单数据的获取,对歌单数据进行可视化分析。得出歌单的评论、收藏、播放、贡献、分布的数量图以及词云,并提出歌单优化的建议。
项目利用爬虫对数据获取,后对其进行数据清洗,最终进行数据可视化。在分析过程中使用 numpy, pandas, matplotlib, time, requests, squarify, jieba, wordcloud, bs4 第三方模块,最后以柱状图,词云图 以及标签图来展示歌曲收藏量,播放量等相关分析结果并结合相关数据优化歌单播放量。
最后我们实现了项目,并对项目进行了测试。
图 8 网易云音乐欧美歌单评论 TOP10 的流程图
图 9 欧美歌单播放数量分布情况的流程图
图 10 网易云音乐欧美歌单标签图的流程图
图 11 歌单介绍词云图的流程图
网易云用户是很习惯创建歌单的一个用户群体,很多用户也是通过歌单了解到一些歌曲。一个网易云用户甚至自己一个人就创建上百个歌单,我们爬取了网易云欧美歌单的数据,制作了以下表格。
图 12 网易云音乐欧美歌单歌曲 TOP10
我们获得了网易云音乐欧美歌单中的 TOP10 歌曲,相信熟悉欧美歌曲的小伙伴们对这些歌都很熟悉,他们曾经或许就出现在推荐给你的歌单中。
图 13 网易云音乐欧美歌单播放 TOP10
这是欧美歌单播放量前十排行榜,第一名拥有高达 4 亿的播放量,可见欧美歌曲是非常令人欢迎的。在歌单中统计中我们可以看到旋律和节奏是很多欧美音乐爱好者们比较看重和喜欢的。
图 14 网易云音乐欧美歌单评论 TOP10
可以看到歌单【定制 最懂你的欧美推荐 每日更新35首】的评论数量最多。这可能与他日更与定制的性质有关。可以看到,很多热门的歌单其评论通常也很多。这个榜单中的歌单在上一个热门歌单的榜单也能找到。
图 15 欧美歌单播放数量分布情况
将播放数做对数处理,使得能直观看出歌单播放数的分布。
歌单播放数主要分布在 0-1000 万。
其中 ln(10000000) = 16。
图 16 网易云音乐欧美歌单标签图
我们还找到了这些歌单的标签情况,既然是欧美歌单,【欧美】自然就占大头,几乎一半。我们还可以看到【电子】和【流行】这两大类也是非常多,【欧美流行】和【欧美电子】近两年在网易云用户中越来越火爆,特别是【欧美电子】,不少青年已经是电子音乐的忠实粉丝。
图 17 歌单介绍词云图
歌单介绍词云图,这些词包括一个歌单的风格,背景还有故事。或许你曾经是因为哪一个词打动了你,让你收藏的这份歌单。与歌曲产生共鸣。
歌单有两种形式,一种是由官方创建的歌单,另一种是由用户自主创建的歌单,在网易云中,我们收藏倾听的大多来自个人用户。而歌单的运营不论是对个人还是官方都是有意义的。
很多用户是以歌单作为入口来了解音乐的,很少主动的的持续的去搜索音乐,所以歌单是否丰富,歌单的品质是否足够好,决定了用户使用的频率和时间。用户能够获取到越多越好的好歌单,就意味着这个音乐平台更有价值。
对于个人而言,创造令很多人满意的歌单,让个人获得关注,更高的成就感,进而创造更好的精品歌单。
所以我们基于以上的分析,做出了一个关于欧美歌单的运营分析:
在歌单内容方面,图15 网易云音乐欧美歌单标签图里,我们可以看出,流行类标签和电子标签占比大约 50%。以标签分类实行个性化推荐,可以让歌单更容易被找到,曝光,便于管理。
另外我们的歌单可以向这两个热门的方向靠拢,面向受众面广的人群,可以获得可观的流量。再加上电子音乐的兴起,越来越优秀的电子音乐出现,可以丰富我们的歌单。
在歌单标题方面,歌单相当于一篇文章,歌单的标题可以吸引听众的注意力,让他们进来了解歌单,收听歌单。在歌单播放量 TOP10 和歌单评论数量 TOP10 中,我们区分出以下几类:
在特殊标志式方面,在前十的几个歌单名称中我们可以看到“【】“,”|“等特殊字符,这些特殊字符可以吸引听众的目光,强调自己歌单的亮点。
在强吸引式方面,使用“精选“,”10w+“,”专属“等字眼,驱使听众点击。
在结论式方面使用,“热血燃向 | 提神醒脑防嗜睡型 BGM” 等字眼,驱使听众点击。
综上所述,一份歌单成功离不开标题、歌曲风格、乃至歌曲数。只有平衡好其中的因素,才能使其播放量达到预期。
歌单数据可视化可以帮助音乐公司更好地理解消费者喜好,并为消费者提供更符合他们喜好的歌单。
此外,歌单数据可视化还可以帮助音乐公司更好地分析歌单中的信息,并利用这些信息来决定如何定价、营销和分销音乐。
因此,歌单数据可视化具有一定的商业价值,可以为音乐公司提供重要的市场信息。