数据分析为什么常用Jupyter而不是直接使用Python脚本或Excel?

不知道你用过谷歌的Colab没有,这是一个线上的notebook编辑器,可以免费使用CPU/GPU资源进行Python开发,而Colab其实就是一个云端的Jupyter notebook页面。

当你浏览Vscode插件市场,会发现最受欢迎的前10名,有3个是Jupyter相关的插件。

Kaggle比赛的主要编程环境同样是Jupyter,为什么Jupyter这么受欢迎呢?我建议使用Python编程的都应该学会Jupyter,因为它会给你意想不到的体验。

如果说Jupyter只是一款Python编辑器,那未免过于片面。其实它是集编程、笔记、数据分析、机器学习、可视化、教学演示、交互协作等于一体的超级web应用,而且支持python、R、Julia、Scala等超40种语言。

Jupyter最大的特点是代码即写可即运行,其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。比如我用Bokeh绘制可视化内容,只需要输入脚本代码并执行,便可以在Jupyter上显示相应图表。

Jupyter中所有交互计算、编写说明文档、数学公式、图片以及其他富媒体形式的输入和输出,都是以文档的形式体现的。这些文档是保存为后缀名为.ipynb的JSON格式文件,不仅便于版本控制,也方便与他人共享。

此外,文档还可以导出为:HTML、LaTeX、PDF等格式。

Jupyter还支持安装插件,和VsCode类似。插件类型也很丰富,包括了代码调试、可视化、文本编辑等等。

既然同样是编程工具,那Jupyter和Pycharm、VsCode的使用场景有什么区别呢?

Jupyter主要是用来做数据科学,其包含数据分析、数据可视化、机器学习、深度学习、机器人等等,任何Python数据科学第三方库都能在Jupyter上得到很好的应用和支持。现在几乎所有的数据比赛平台都以Jupyter作为编辑工具,在上面实现各种数据分析场景。

在产品上,Jupyter不仅有简洁的Notebook ,还有工作台式的Lab,甚至线上平台化部署的Hub,对个人、团队、企业都可以完美支持。

所以如果你有以下工作场景,可以大胆使用Jupyter作为主力开发工具。

1、任何涉及数据处理、清洗、分析、建模的场景

2、绘制二维、三维可视化图表,制作可视化报告

3、需要多人协作的Python数据科学项目

4、各种算法的前期验证

5、写编程作业、记录课堂笔记

6、课堂编程相关的内容展示、实验

其他还有很多,就不一一列举了,附上Jupyter的使用小技巧。

相关推荐
程序员龙叔3 小时前
编写高质量 Skill 系列 -- 如何设计需求分析与用例生成的 SKILL
自动化测试·软件测试·python·软件测试工程师·接口测试·性能测试·skill·ai测试
用户8356290780516 小时前
使用 Python 操作 Word 内容控件
后端·python
码云骑士7 小时前
32-慢查询排查全流程(下)-索引优化实战与最左前缀原则
python
王小王-1238 小时前
基于 Hive 的网易云音乐数据分析及可视化系统
hive·hadoop·数据分析·音乐数据分析·网易云音乐分析·hive音乐分析·hadoop网易云
闵孚龙8 小时前
《PyTorch 深度修炼》Dataset 和 DataLoader:数据如何喂给模型
人工智能·pytorch·python
goldenrolan8 小时前
A公司物料替代测试系统 v1.7:从需求到 exe/apk 的 AI 辅助全链路实践
android·自动化测试·软件测试·python·ai
菜板春8 小时前
jupyter入门-手册-特征探索
python·jupyter
Metaphor6929 小时前
使用 Python 将 PDF 转换为 HTML
python·pdf·html
极光代码工作室9 小时前
基于数据仓库的电商数据分析平台
大数据·hadoop·python·spark·数据可视化