Jupyter Notebook 是几乎所有面向 Python 编程任务的最受欢迎的集成开发环境之一,例如数据科学、机器学习、科学计算等。
它的交互式编码能力使其不仅成为初学者的首选工具,也是专家们的首选。
然而,尽管它被广泛使用,但许多用户并未充分发挥其潜力。
因此,他们往往使用 Jupyter 的默认界面/功能,而在我看来,这可以显著改进以提供更丰富的体验。
因此,在本文中,我将介绍5个很酷的Jupyter技巧,您可能甚至不知道它们存在。
这些技巧将使您能够通过这个强大的工具实现新的生产力和创造力水平。
让我们开始吧 🚀!
通常,当我们在Jupyter中加载DataFrame时,我们通过打印来预览它。如下所示:
df
然而,这几乎没有提供有关这些数据内容的任何信息。
因此,人们不得不通过分析它来深入了解,这涉及到简单但重复的代码。
相反,使用Jupyter-DataTables。您可以按照以下步骤进行安装:
pip install jupyter-datatables
要使用它,请在Jupyter中运行以下代码:
from jupyter_datatables import init_datatables_mode
init_datatables_mode()
它通过许多有用的功能对DataFrame的默认预览进行了强化。
因此,每当您打印一个DataFrame时,它将显示得更加优雅,如下所示。
这个更丰富的预览提供了排序、过滤、导出和分页操作,以及列分布和数据类型
并非所有的数据在获取时都是预先标记的。
因此,通常在使用未标记的数据时,您可能需要花一些时间进行注释/标记。
与在外部预览文件并标记它们或构建复杂的注释流水线相反,您可以使用𝐢𝐩𝐲𝐚𝐧𝐧𝐨𝐭𝐚𝐭𝐞在几行代码中进行注释。
它提供了专门用于数据注释的Jupyter小部件。
运行以下命令进行安装:
pip install ipyannotate
jupyter nbextension enable --py --sys-prefix ipyannotate
通过点击按钮进行数据注释变得更加简单。因此,ipyannotate允许您将数据标签附加到按钮上。
假设我们有一些猫和狗的图像(未标记)。我们可以创建一个如下所示的注释流水线:
如上所示,您可以通过简单点击相应的按钮来注释您的数据。
而且,您还可以检索标签并根据需要在您的数据流水线中使用它们。
在Jupyter中工作时,经常会忘记函数的参数并查看官方文档(或StackOverflow)。
然而,您可以在笔记本中查看文档。
按下 𝐒𝐡𝐢𝐟𝐭-𝐓𝐚𝐛 打开文档面板。这非常有用,可以节省时间,因为您不必每次都打开官方文档。
下面是一个演示:
此功能也适用于您的自定义函数。
在Jupyter单元格中运行一些代码后,我们通常会切换到其他工作。
在这里,人们必须反复回到Jupyter标签页,以检查单元格是否已执行。
为了避免这种情况,您可以使用%%𝐧𝐨𝐭𝐢𝐟𝐲魔术命令来自jupyternotify扩展。
正如其名称所示,它通过浏览器通知在Jupyter单元格完成时通知用户(成功和失败)。
要安装它,请运行以下命令:
pip install jupyternotify
接下来,加载扩展:
%load_ext jupyternotify
搞定了!
现在,每当您想收到通知时,请在单元格顶部输入以下魔术命令:
%%notify
每当单元格完成执行时,您将收到以下通知:
单击通知将带您回到Jupyter标签页。
在使用Jupyter时,我们通常会打印许多细节以跟踪代码的进度。
然而,当输出面板积累了大量细节时,我们只对最新的输出感兴趣时,这会令人沮丧。
此外,每次都滚动到输出底部也可能令人讨厌。
要清除单元格的输出,可以使用IPython包中的𝗰𝗹𝗲𝗮𝗿_𝗼𝘂𝘁𝗽𝘂𝘁方法。
IPython已与Python预装,因此无需安装。
您可以按如下导入该方法:
from IPython.display import clear_output
在调用时,它将删除单元格的当前输出,之后您可以打印最新的细节。
下面展示了一个演示:
如上所演示,我们只看到单元格中的最新输出。之前的输出被抹掉了。
今天分享了一些令人难以置信的 Jupyter 技巧。我相信这些提示将提升您的Python编程效率。
独学而无优则孤陋而寡闻,技术要学会交流、分享,不建议闭门造车。
技术交流与答疑、源码获取,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。
方式①、微信搜索公众号:Python学习与数据挖掘,后台回复:交流
方式②、添加微信号:dkl88194,备注:交流
资料1
资料2
我们打造了《数据分析实战案例宝典》,特点:从0到1轻松学习,方法论及原理、代码、案例应有尽有,所有案例都是按照这样的节奏进行表述。