Python智能挖掘数据新秘器

发布时间:2024年01月19日

大家好,本次分享一款在数据探索中表现出色的工具—Python Lux ,通过自动化可视化和数据分析过程,使得数据探索变得更加快捷方便。

Lux的使用方法非常简单,只需在Jupyter notebook中输入dataframe,Lux就会智能推荐一组基于数据趋势和模式的可视化。在Lux的交互式小部件中,你可以轻松浏览各种可视化,快速理解数据中的信息。不再需要复杂的代码和繁琐的操作,Lux为数据分析提供了一种更为直观和高效的方式。

在本文中,我们将深入介绍Lux Python库的基本功能,助你更好地理解如何利用这一工具简化你的数据探索任务。让我们一起看看Lux如何在实际应用中发挥作用吧。


Lux安装

conda install -c conda-forge lux-api
jupyter nbextension install --py luxwidget
jupyter nbextension enable --py luxwidget

出现以下内容,说明Lux已经安装成功,


Lux使用非常简单,只需要提供dataframe即可。

Lux自动探索数据

Lux自动推荐一组可视化,突显数据集中的有趣趋势和模式。

Lux根据数据属性推荐了一组可交互的可视化图表,现在您可以使用它们来进一步探索您的数据集!


Lux自动探索数据+人工干预

我们也可以告诉 Lux 感兴趣的属性和值,基于这个意图,Lux会引导用户朝着他们探索中的潜在下一步。例如,我们可能对数据集中的AverageCost 和 SATAverage 感兴趣。

结果包含两个部分,左侧是我们感兴趣的字段关系图,在右侧,Lux 生成了三组推荐,以单独的标签组织在小部件上:

右侧"Enhance":向当前选择添加一个额外的属性,从根本上突显额外变量如何影响 AverageCost 和 SATAverage 之间的关系。

右侧"Filter":向当前选择添加一个过滤器,同时保持属性(在 X 轴和 Y 轴上)不变。

右侧"Generalize":移除一个属性,以显示更一般的趋势,展示 AverageCost 和 SATAverage 的分布情况。?


导出代码进一步探索

选中感兴趣的结果图导出代码进一步探索,如下图,先选中目的图,然后右侧导出,

vis = df.exported[0]
vis

支持导出 matplotlib、altair和vegalite格式代码,

print (vis.to_code("matplotlib"))
print (vis.to_code("altair"))
print (vis.to_code("vegalite"))

例如altair代码,

ref:?https://github.com/lux-org/lux

????更多干货👇👇👇

文章来源:https://blog.csdn.net/qq_21478261/article/details/135652589
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。