六个实用的Python数据可视化图表

发布时间:2024年01月15日

在美国大学数学建模竞赛(MCM/ICM)中,获得 Outstanding(O)奖的论文往往不仅在问题求解上有深度,更在图表的呈现上展现了高逼格的水平。学习一些制作高逼格图片的绘制技巧,助你在论文中展现更专业、美观的图表。

美赛高逼格图片绘制

基本要求

展示思路,形象地展现结果,提高逼格。

图的标题要放在下方,且带有编号(表上图下)

注意排版,要无首行缩进,居中对齐。

常见作图软件

最简单:PPT、Excel、AxGlph、Origin、visi

编程类:Python、MATLAB、SPSS

专业类:COMSOL(物理)、CAD(工程制图)、Mapinfo(地理信息)

非学术类:ProcessOn、亿图、Xmind

万能神器

ECharts,由JavaScript实现的开源可视化库,功能齐全

太多了不知道选哪个?Python足够解决一切!

对于小白,有图最好,但如果做不出来,也不必刻意为了作图而去作图!

Python数据可视化

1、平行坐标图

我们最多可以可视化 3 维数据。但是我们有时需要可视化超过 3 维的数据才能获得更多的信息。我们经常使用 PCA 或 t-SNE 来降维并绘制它。在降维的情况下,可能会丢失大量信息。在某些情况下,我们需要考虑所有特征, 平行坐标图有助于做到这一点。

上面的图片。横线(平行轴)表示鸢尾花的特征(花瓣长、萼片长、萼片宽、花瓣宽)。分类是Setosa, Versicolor和Virginica。上图将该物种编码为Setosa→1,Versicolor→2,Virginica→3。每个平行轴包含最小值到最大值(例如,花瓣长度从1到6.9,萼片长度从4.3到7.9,等等)。例如,考虑花瓣长度轴。这表明与其他两种植物相比,濑蝶属植物的花瓣长度较小,其中维珍属植物的花瓣长度最高。有了这个图,我们可以很容易地获得数据集的总体信息。数据集是什么样子的?

让我们用Plotly Express库[1]可视化数据。Plotly库提供了一个交互式绘图工具。

2、六边形分箱图

六边形分箱图是一种用六边形直观表示二维数值数据点密度的方法。

如果仔细观察图表,我们会发现总面积被分成了无数个六边形。每个六边形覆盖特定区域。我们注意到六边形有颜色变化。六边形有的没有颜色,有的是淡绿色,有的颜色很深。根据图右侧显示的色标,颜色密度随密度变化。比例表示具有颜色变化的数据点的数量。六边形没有填充颜色,这意味着该区域没有数据点。

其他库,如 matplotlib、seaborn、bokeh(交互式绘图)也可用于绘制它。

3、等高线密度图

二维等高线密度图是可视化特定区域内数据点密度的另一种方法。这是为了找到两个数值变量的密度。例如,下面的图显示了在每个阴影区域有多少数据点。

为了生成上面的图表,这里使用了plotly库,因为它可以方便地绘制交互式的图表。这里绘制了两个变量 sepal_width 和 sepal_length 的密度。当然,也可以使用其他库,如seaborn、matplotlib等。

4、小提琴图

小提琴图与箱线图相关。我们能从小提琴图中获得的另一个信息是密度分布。简单来说就是一个结合了密度分布的箱线图。我们将其与箱线图进行比较。

在小提琴图中,小提琴中间的白点表示中点。实心框表示四分位数间距 (IQR)。上下相邻值是异常值的围栏。超出范围,一切都是异常值。下图显示了比较。

让我们看看小提琴图的可视化

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

我们还可以通过传递名称来绘制不同物种的小提琴图。

还可以使用其他库,如plotly、matplotlib等来绘制小提琴图。

5、箱线图的改进版

Boxenplot 是 seaborn 库引入的一种新型箱线图。对于箱线图,框是在四分位数上创建的。但在 Boxenplot 中,数据被分成更多的分位数。它提供了对数据的更多内存。

鸢尾花数据集的 Boxenplot 显示了 sepal_width 的数据分布。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

上图显示了比箱线图更多的盒。这是因为每个框代表一个特定的分位数。

6、词云(Word Cloud)

词云图的想法非常简单。假设我们有一组文本文档。单词有很多,有些是经常出现的,有些是很少出现的。在词云图中,所有单词都被绘制在特定的区域中,频繁出现的单词被高亮显示(用较大的字体显示)。

我们统计每个类别的数据数量

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

我们进行可视化。

该图表显示了频率最高的所有类别。我们也可以用这个图从文本中找到经常出现的单词。

美赛中,高逼格的图片是论文成功的关键之一。通过选择合适的绘图工具、精心处理数据、遵循图表设计原则、使用高级图表类型以及注重标注和解释,为你的论文锦上添花!数模乐园作为国内美赛报名最大官方平台。为同学们附赠纸质证书打印邮寄、美赛赛题解析、美赛专属礼包、赛题翻译等备赛资料,帮助大家更好的备赛。最后祝大家都可以取的好成绩!

以上就是“六个实用的Python数据可视化图表”的全部内容,希望对你有所帮助。
?
?关于Python技术储备

学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

二、Python必备开发工具

img

三、Python视频合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

img

四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

img

五、Python练习题

检查学习结果。

img

六、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

img

最后祝大家天天进步!!

上面这份完整版的Python全套学习资料已经上传至CSDN官方,朋友如果需要可以直接微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】。

文章来源:https://blog.csdn.net/Trb201012/article/details/135551889
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。