数据分析为什么常用Jupyter而不是直接使用Python脚本或Excel?

不知道你用过谷歌的Colab没有,这是一个线上的notebook编辑器,可以免费使用CPU/GPU资源进行Python开发,而Colab其实就是一个云端的Jupyter notebook页面。

当你浏览Vscode插件市场,会发现最受欢迎的前10名,有3个是Jupyter相关的插件。

Kaggle比赛的主要编程环境同样是Jupyter,为什么Jupyter这么受欢迎呢?我建议使用Python编程的都应该学会Jupyter,因为它会给你意想不到的体验。

如果说Jupyter只是一款Python编辑器,那未免过于片面。其实它是集编程、笔记、数据分析、机器学习、可视化、教学演示、交互协作等于一体的超级web应用,而且支持python、R、Julia、Scala等超40种语言。

Jupyter最大的特点是代码即写可即运行,其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。比如我用Bokeh绘制可视化内容,只需要输入脚本代码并执行,便可以在Jupyter上显示相应图表。

Jupyter中所有交互计算、编写说明文档、数学公式、图片以及其他富媒体形式的输入和输出,都是以文档的形式体现的。这些文档是保存为后缀名为.ipynb的JSON格式文件,不仅便于版本控制,也方便与他人共享。

此外,文档还可以导出为:HTML、LaTeX、PDF等格式。

Jupyter还支持安装插件,和VsCode类似。插件类型也很丰富,包括了代码调试、可视化、文本编辑等等。

既然同样是编程工具,那Jupyter和Pycharm、VsCode的使用场景有什么区别呢?

Jupyter主要是用来做数据科学,其包含数据分析、数据可视化、机器学习、深度学习、机器人等等,任何Python数据科学第三方库都能在Jupyter上得到很好的应用和支持。现在几乎所有的数据比赛平台都以Jupyter作为编辑工具,在上面实现各种数据分析场景。

在产品上,Jupyter不仅有简洁的Notebook ,还有工作台式的Lab,甚至线上平台化部署的Hub,对个人、团队、企业都可以完美支持。

所以如果你有以下工作场景,可以大胆使用Jupyter作为主力开发工具。

1、任何涉及数据处理、清洗、分析、建模的场景

2、绘制二维、三维可视化图表,制作可视化报告

3、需要多人协作的Python数据科学项目

4、各种算法的前期验证

5、写编程作业、记录课堂笔记

6、课堂编程相关的内容展示、实验

其他还有很多,就不一一列举了,附上Jupyter的使用小技巧。

相关推荐
ZTLJQ3 小时前
序列化的艺术:Python JSON处理完全解析
开发语言·python·json
H5css�海秀3 小时前
今天是自学大模型的第一天(sanjose)
后端·python·node.js·php
阿贵---3 小时前
使用XGBoost赢得Kaggle比赛
jvm·数据库·python
无敌昊哥战神4 小时前
【LeetCode 257】二叉树的所有路径(回溯法/深度优先遍历)- Python/C/C++详细题解
c语言·c++·python·leetcode·深度优先
李昊哲小课5 小时前
第1章-PySide6 基础认知与环境配置
python·pyqt·pyside
2401_894241926 小时前
用Pygame开发你的第一个小游戏
jvm·数据库·python
Zzzz_my7 小时前
正则表达式(RE)
pytorch·python·正则表达式
天天鸭7 小时前
前端仔写了个 AI Agent,才发现大模型只干了 10% 的活
前端·python·ai编程
setmoon2148 小时前
使用Scikit-learn构建你的第一个机器学习模型
jvm·数据库·python
2401_833197738 小时前
为你的Python脚本添加图形界面(GUI)
jvm·数据库·python