数据分析为什么常用Jupyter而不是直接使用Python脚本或Excel?

不知道你用过谷歌的Colab没有,这是一个线上的notebook编辑器,可以免费使用CPU/GPU资源进行Python开发,而Colab其实就是一个云端的Jupyter notebook页面。

当你浏览Vscode插件市场,会发现最受欢迎的前10名,有3个是Jupyter相关的插件。

Kaggle比赛的主要编程环境同样是Jupyter,为什么Jupyter这么受欢迎呢?我建议使用Python编程的都应该学会Jupyter,因为它会给你意想不到的体验。

如果说Jupyter只是一款Python编辑器,那未免过于片面。其实它是集编程、笔记、数据分析、机器学习、可视化、教学演示、交互协作等于一体的超级web应用,而且支持python、R、Julia、Scala等超40种语言。

Jupyter最大的特点是代码即写可即运行,其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。比如我用Bokeh绘制可视化内容,只需要输入脚本代码并执行,便可以在Jupyter上显示相应图表。

Jupyter中所有交互计算、编写说明文档、数学公式、图片以及其他富媒体形式的输入和输出,都是以文档的形式体现的。这些文档是保存为后缀名为.ipynb的JSON格式文件,不仅便于版本控制,也方便与他人共享。

此外,文档还可以导出为:HTML、LaTeX、PDF等格式。

Jupyter还支持安装插件,和VsCode类似。插件类型也很丰富,包括了代码调试、可视化、文本编辑等等。

既然同样是编程工具,那Jupyter和Pycharm、VsCode的使用场景有什么区别呢?

Jupyter主要是用来做数据科学,其包含数据分析、数据可视化、机器学习、深度学习、机器人等等,任何Python数据科学第三方库都能在Jupyter上得到很好的应用和支持。现在几乎所有的数据比赛平台都以Jupyter作为编辑工具,在上面实现各种数据分析场景。

在产品上,Jupyter不仅有简洁的Notebook ,还有工作台式的Lab,甚至线上平台化部署的Hub,对个人、团队、企业都可以完美支持。

所以如果你有以下工作场景,可以大胆使用Jupyter作为主力开发工具。

1、任何涉及数据处理、清洗、分析、建模的场景

2、绘制二维、三维可视化图表,制作可视化报告

3、需要多人协作的Python数据科学项目

4、各种算法的前期验证

5、写编程作业、记录课堂笔记

6、课堂编程相关的内容展示、实验

其他还有很多,就不一一列举了,附上Jupyter的使用小技巧。

相关推荐
花酒锄作田9 小时前
使用 pkgutil 实现动态插件系统
python
前端付豪12 小时前
LangChain链 写一篇完美推文?用SequencialChain链接不同的组件
人工智能·python·langchain
曲幽13 小时前
FastAPI实战:打造本地文生图接口,ollama+diffusers让AI绘画更听话
python·fastapi·web·cors·diffusers·lcm·ollama·dreamshaper8·txt2img
老赵全栈实战13 小时前
Pydantic配置管理最佳实践(一)
python
阿尔的代码屋19 小时前
[大模型实战 07] 基于 LlamaIndex ReAct 框架手搓全自动博客监控 Agent
人工智能·python
AI探索者2 天前
LangGraph StateGraph 实战:状态机聊天机器人构建指南
python
AI探索者2 天前
LangGraph 入门:构建带记忆功能的天气查询 Agent
python
FishCoderh2 天前
Python自动化办公实战:批量重命名文件,告别手动操作
python
躺平大鹅2 天前
Python函数入门详解(定义+调用+参数)
python
曲幽2 天前
我用FastAPI接ollama大模型,差点被asyncio整崩溃(附对话窗口实战)
python·fastapi·web·async·httpx·asyncio·ollama