数据分析如何正确使用ChatGPT进行辅助?

目录

1.数据介绍

2.特征工程

3.EDA分析

4.数据相关性分析

5.分析总结


**一篇优秀的学术论文,肯定有新颖、适当的论证视角,**选择恰当的研究方法,搭建逻辑严密、平衡的论证框架,把有力的数据分析紧密结合起来,这样一篇论文将具有逻辑严密的论证过程。小编在之前的AI工具论文写作流程中,介绍了大量论文文字工作, 今天小编使用Kaggle数据,给大家分享一下学术论文中数据分析相关内容使用Kimi的效果。

1.数据介绍

首先介绍一下数据集,数据集我在Kaggle上下载了一个房价预测的数据集。具体使用到的有两个文件。

-------------------------------------------------------

其中**[data_description.txt]**文件主要是对数据集中每一列的描述。

-------------------------------------------------------

**[train.csv]**就是今天案例所用到的数据集了。

2.特征工程

我们先让Kimi对数据做一下特征工程。

**特征工程(Feature Engineering)**是数据预处理和机器学习领域中的一个重要步骤。它涉及到从原始数据中选择、修改和创建新的特征(即数据的属性或变量),以便更好地适应机器学习算法的需求,并最终提高模型的性能。特征工程的主要目的是使原始数据集更适合用于建模和分析。

提示词:

根据data_description.txt对数据集的描述

Train.csv进行特征工程


ChatGPT反馈:

3.EDA分析

让ChatGPT对数据做Exploratory data analysis (探索性数据分析)。

**探索性数据分析(Exploratory Data Analysis,简称EDA)**是数据分析的一种方法论,它侧重于使用各种技术来大致理解数据集的主要特征。这个过程通常是数据分析项目的初步步骤,旨在通过摘要和可视化手段来发现数据的模式、异常、关键变量和潜在的关系。

提示词:

根据特征工程后的数据,对数据集进行Exploratory data analysis (探索性数据分析)


ChatGPT反馈:

4.数据相关性分析

最后我们让ChatGPT对数据集中对房价影响最大的15种数据进行相关性分析。

提示词:

提取对房屋销售价格影响最高的15个特征做相关性分析。


ChatGPT反馈:

5.分析总结

最后我们让ChatGPT对分析过程做一个总结。ChatGPT做数据分析也相当简单,而且生成的图表也可直接用于论文辅佐论点的论证!

提示词:

站在一个**[数据分析师]**的角度 对上述分析过程做一个总结。


ChatGPT反馈:

相关推荐
Tom Boom3 分钟前
Git常用命令完全指南:从入门到精通
大数据·git·elasticsearch·docker·自动化测试框架
机器之心4 分钟前
MoE推理「王炸」组合:昇腾×盘古让推理性能狂飙6-8倍
人工智能
艾醒(AiXing-w)13 分钟前
探索大语言模型(LLM):RSE流程详解——从文档中精准识别高相关片段
数据库·人工智能·语言模型
陈奕昆35 分钟前
4.2 HarmonyOS NEXT分布式AI应用实践:联邦学习、跨设备协作与个性化推荐实战
人工智能·分布式·harmonyos
AI.NET 极客圈1 小时前
.NET 原生驾驭 AI 新基建实战系列(六):Pinecone ── 托管向量数据库的向量数据库的云原生先锋
数据库·人工智能·.net
YBCarry_段松啓1 小时前
uv:下一代 Python 包管理器
人工智能·python
聚客AI1 小时前
深度解构神经网络的底层引擎:从感知机到反向传播的数学之旅
人工智能·神经网络·掘金·日新计划
yorushika_1 小时前
python打卡训练营打卡记录day45
开发语言·python·深度学习·tensorboard
张较瘦_1 小时前
[论文阅读] 人工智能+软件工程 | 用大模型优化软件性能
论文阅读·人工智能·软件工程
机器之心1 小时前
深夜突袭!谷歌Gemini 2.5 Pro更新蝉联榜一:推理超越o3,编程超越opus4
人工智能·gemini