ChatGPT 代码解释器:分钟级完成数据分析

作为一名数据科学家,我始终在寻找提高效率和通过数据推动业务价值的方法。

因此,当ChatGPT发布了其最强大的功能之一------Code Interpreter插件时(我将其翻译为代码解释器),我必须尝试并将其纳入我的工作流程中。

什么是 ChatGPT 代码解释器?

如果你还没有听说过Code Interpreter,这是一个新功能,允许你在ChatGPT界面中上传代码、运行程序和分析数据。

在过去的一年里,每当我需要调试代码或分析文档时,我都必须将我的工作复制并粘贴到ChatGPT中以获取响应。

这证明是耗时的,而且ChatGPT界面有一个字符限制,这限制了我分析数据和执行机器学习工作流的能力。

虽然它被称为"Code Interpreter",但这个功能不仅限于程序员,该插件还可以帮助你分析文本文件、总结PDF文档、构建数据可视化,并根据你的需求裁剪图像。

如何访问代码解释器?

在我们介绍其应用之前,让我们快速了解如何开始使用Code Interpreter插件。

要访问这个插件,你需要订阅ChatGPT Plus的付费订阅,目前价格为每月20美元。

不幸的是,没有订阅ChatGPT Plus的用户无法使用Code Interpreter。

一旦你订阅了付费计划,只需进入ChatGPT并点击界面左下角的三个点。

然后,选择设置:

点击"Beta功能",并启用上面写着"代码解释器"的滑块:

最后,点击"新聊天",选择"GPT-4"选项,并在出现的下拉菜单中选择"代码解释器":

您将看到一个类似于此的屏幕,文本框附近有一个"+"符号。

很好!您现在已成功启用 ChatGPT 代码解释器。

在本文中,我将向您展示使用代码解释器自动执行数据科学工作流的几种方法。

1. 数据汇总

作为数据科学家,我花了很多时间试图理解数据集中存在的不同变量。

代码解释器非常擅长为您分解每个数据点。

以下是您可以让该模型帮助您汇总数据的方法:

让我们以Kaggle上的"泰坦尼克号生存预测"数据集为例。我将使用"train.csv"文件。

下载数据集并导航到代码解释器。

点击"+"符号并上传要摘要的文件。

然后,询问ChatGPT以简单的方式解释此文件中的所有变量:

非常好!

代码解释器为我们提供了数据集中每个变量的简单解释。

2. 探索性数据分析

现在我们已经了解了数据集中不同变量的情况,让我们请求Code Interpreter更进一步地进行一些探索性数据分析(EDA)。

该模型生成了5个图形,使我们能够更好地了解数据集中的不同变量。

如果您点击"显示工作"下拉菜单,您会注意到Code Interpreter编写并运行了Python代码,以帮助我们实现最终结果:

如果您想进行进一步的分析,您可以随时将此代码复制粘贴到自己的Jupyter Notebook中。

ChatGPT还根据生成的可视化提供了一些关于数据集的见解:

它告诉我们女性、头等舱乘客和年轻乘客的生存率更高。

这些是需要时间手动推导出来的见解,尤其是如果您不熟悉Python和数据可视化库(如Matplotlib)。

Code Interpreter仅用几秒钟生成了它们,极大地减少了进行EDA所需的时间。

3. 数据预处理

我花费了很多时间清理数据集并为建模过程做准备。

让我们请求Code Interpreter帮助我们预处理这个数据集:

Code Interpreter概述了清理这个数据集所涉及的所有步骤。

它告诉我们需要处理三列缺失值、对两个分类变量进行编码、进行一些特征工程并删除与建模过程无关的列。

然后,它创建了一个Python程序,仅用几秒钟就完成了所有预处理工作。

如果您想了解模型执行数据清理的步骤,可以单击"显示工作":

然后,我询问ChatGPT如何保存输出文件,它为我提供了可下载的CSV文件:

请注意,在整个过程中,我甚至不需要运行一行代码。Code Interpreter能够导入我的文件、在界面内运行代码,并以记录时间为我提供输出。

相关推荐
墨风如雪39 分钟前
告别“面目全非”!腾讯混元3D变身“建模艺术家”,建模效率直接起飞!
aigc
九年义务漏网鲨鱼1 小时前
【大模型学习 | MINIGPT-4原理】
人工智能·深度学习·学习·语言模型·多模态
元宇宙时间1 小时前
Playfun即将开启大型Web3线上活动,打造沉浸式GameFi体验生态
人工智能·去中心化·区块链
开发者工具分享1 小时前
文本音频违规识别工具排行榜(12选)
人工智能·音视频
产品经理独孤虾2 小时前
人工智能大模型如何助力电商产品经理打造高效的商品工业属性画像
人工智能·机器学习·ai·大模型·产品经理·商品画像·商品工业属性
老任与码2 小时前
Spring AI Alibaba(1)——基本使用
java·人工智能·后端·springaialibaba
蹦蹦跳跳真可爱5892 小时前
Python----OpenCV(图像増强——高通滤波(索贝尔算子、沙尔算子、拉普拉斯算子),图像浮雕与特效处理)
人工智能·python·opencv·计算机视觉
雷羿 LexChien2 小时前
从 Prompt 管理到人格稳定:探索 Cursor AI 编辑器如何赋能 Prompt 工程与人格风格设计(上)
人工智能·python·llm·编辑器·prompt
两棵雪松3 小时前
如何通过向量化技术比较两段文本是否相似?
人工智能
heart000_13 小时前
128K 长文本处理实战:腾讯混元 + 云函数 SCF 构建 PDF 摘要生成器
人工智能·自然语言处理·pdf