点赞 + 关注 + 收藏 = 学会了
什么是 Jupyter Notebook ?
在 《Python 快速入门篇》 里我提到了3个编辑器,其中一个是 Jupyter Notebook
。
Jupyter Notebook
是一个基于网页的交互式计算环境,是大多数数据分析师喜欢的工具。它可以用来写代码、运行代码、可视化数据,甚至可以当笔记本使用。
相比起 VS Code
和 PyCharm
,Jupyter Notebook
有以下几个优势。
- **
Jupyter Notebook
支持用Markdown
和LaTex
写注释。**在做数据分析时,通常需要说明数据的来源、分析时使用的公式和思路等信息。Jupyter Notebook
支持使用Markdown
写注释,比起其他编辑器只用通过#
或者"""
的方式写Python
代码的注释属于降维打击了。Jupyter Notebook
还支持使用LaTex
写复杂的数理化公式,这也是其他编辑器通常不具备的功能。 - **
Jupyter Notebook
可以按单元格运行代码。**在做数据分析时,需要导入和清洗数据,然后再套公式做数据分析。当数据量很大时,导入数据和清洗数据这两步操作可能会花费大量时间。而在Jupyter Notebook
里,可以将导入数据、清洗数据和分析数据这3个操作分别放在不同的单元格里,导入和清洗只需执行一次,后面分析数据时可以随时换公式,然后只执行分析数据的那个单元格的代码。而不是所有代码都要从头到尾执行一遍,这能大大提高我们的工作效率。 Jupyter Notebook
使用交互模式环境 。VS Code
和PyCharm
写和运行Python
文件时都是用命令行模式。交互模式的好处是可以不使用print
就能输出的单元格的执行结果,方便我们查看代码运行时变量的变化情况。但如果一个单元格里需要输出多个变量的值,还是需要使用print
分别输出。
前面说了 Jupyter Notebook
是数据分析师喜欢的工具,在程序员圈外,其实 Excel
也是数据分析领域的热门工具。但 Jupyter Notebook
的运行效率比 Excel
更高,因为它不需要处理 Excel
关注的文本样式,而且它不会把数据和业务逻辑混在一起。
安装和运行
安装
Jupyter Notebook
的安装很简单,但首先你的电脑需要安装 python
,安装 python
的方法可以参考 《Python 快速入门篇》 。
打开终端,输入以下命令即可安装 Jupyter Notebook
。
pip install notebook
运行
安装成功后,在你电脑指定位置新建一个存放项目代码的文件夹,在终端进入刚刚新建的文件夹目录,输入以下命令可以运行 Jupyter Notebook
。
jupyter notebook
运行上面这段命令后,浏览器会自动打开 http://localhost:8888/tree
这个地址。浏览器里会出现下图的内容。
如果不小心关掉浏览器的话,也可以在终端找回打开地址。
在浏览器输入下图中红框的地址就能重新打开。
关闭
需要关掉 Jupyter Notebook
,在终端窗口按 Control + c
。Mac用户按 command + c
。
使用 Jupyter Notebook
在主面板有当前目录下的所有文件和文件夹。通过点击可以访问不同的目录或打开不同的文件。
创建 Notebook 文件
点击页面右上角 New,之后选择 Notebook。之后在目录里就会出现 .ipynb
后缀的文件。
上面这图,红框区域是文件名,点击后可以自行修改该文件的名字。
蓝框区域是菜单栏和常用工具。
黄框区域是单元格,编写代码就在这个位置进行。
编写与运行代码
举个例子,选中第一个单元格,输入以下代码,然后按 Shift + 回车键
就能运行代码并查看到效果。
python
print("雷猴")
Shift + 回车键
的功能是执行选中单元格的代码,功能和工具栏里的运行按钮是一样的。
前面介绍过,如果单元格里只有1行代码需要输出,可以省略 print()
如果有2行代码都会产生输出结果,不实用 print()
的话只会输出最后一行代码的结果。
如果两行代码都需要输出,那就需要分别给两行代码都用上 print()
。
单元格运行顺序
眼尖的工友应该留意到每个单元格前面多有一个方括号 []
,运行过的单元格前面还有一个数字,这个数字表示单元格运行顺序。
在执行时,左边方括号会先展示星号 *
,表示正在运行。
执行完后,方括号里面回变成数字,数字表示的是执行顺序,比如运行完第一个单元格后,旁边数字显示1,继续运行下一个单元格,旁边数字就会显示2。
Jupyter Notebook
灵活的地方在于你可以选择某个单元格去执行,可以按任意顺序去执行代码。也可以多次反复运行同一个单元格,旁边的数字回帮忙记录和告知执行过的顺序。这对于调试来说是非常方便的。
编辑模式与命令模式
Jupyter Notebook
有编辑模式和命令模式。
点击输入框就能进入编辑模式,在编辑模式时光标会一闪一闪的,而且输入框底色变成白色,边框会高亮。在编辑模式可以输入文字。
点击exc键或者鼠标点击页面空白处(输入框外的地方)就能进入命令模式。进入命令模式后选中项的左侧会有蓝色高亮指示,但输入框底色会变成灰色,而且边框没有高亮,光标也不会出现。
在命令模式下可以使用快捷键操作 Jupyter Notebook
,比如连按两下 d
键就会删除当前单元格。如果在编辑模式下就会输入两个字母 d
。
Jupyter Notebook
支持的快捷键可以在 Help - Show Keyboard Shortcust
里查看。
熟练使用快捷键可以大大提高我们的工作效率。
Markdown
前面提到 Jupyter Notebook
支持使用 Markdown
的方式写代码注释。
方法是选中一个单元格,然后将其切换成 Markdown
模式。
切换到 Markdown
模式后就可以用 Markdown
语法写东西了。
写完按 shift + 回车键
运行该单元格就能转换成更好看的形式。
LaTex
单元格设置为 Markdown
模式后,还可以输入一些特殊领域的公式,比如数理化方面的公式。在做数据分析时也需要将公式展示记录下来。
如果要插入行内公式,可以用 $
将公式包起来。如果要让公式独占一行则需要用 $$
将公式包起来。
ruby
行内公式:$公式$
独占一行:$$公式$$
看看效果:
出来的效果:
LaTex
的语法不是本文重点,有兴趣的工友可以自行百度。