【Educoder数据挖掘实训】了解数据

【Educoder数据挖掘实训】了解数据

开挖

T1 数据集中有多少条数据?

按题目直接输出行数即可

python 复制代码
import pandas as pd
df = pd.read_csv("deaths.csv")
#### Begin ####
print(df.shape[0])
#### End ####

T2 查看数据中的列名

题目里给了 h e a d head head是看前几列, t a i l tail tail是看后几列。而且我们通过输出 h e a d ( ) head() head()发现会将列名输出。故此我们直接输出 h e a d ( 0 ) head(0) head(0)即可。

python 复制代码
import pandas as pd
df = pd.read_csv('deaths.csv')
#### begin ####
print(df.head(0))
#### end ####

T3 选择属性的类型

关于数据类型只需要本地输出一下 t y p e type type即可。

python 复制代码
import pandas as pd
df = pd.read_csv("deaths.csv")

print(df.head())
print(df.values[0][5])
print(df.values[0][2])
print(type(df.values[0][5]))
print(type(df.values[0][2]))

答案: D D C C C B T T DDCCCBTT DDCCCBTT

T4 查看每个属性的类型

扫一遍一个一个输出,看一眼标准输出的格式即可。

python 复制代码
import pandas as pd
df = pd.read_csv('deaths.csv')
data = pd.DataFrame(df)
data = data.iloc[1,:]
#### begin ####

ans = []
for d in data :
    ans.append(type(d))
print(ans)


#### end ####

T5 查看属性的值域

直接输出即可,根据格式可以放在列表里。

python 复制代码
import pandas as pd
df = pd.read_csv('deaths.csv')
data = pd.DataFrame(df)
data = data.iloc[1:,1]
#### begin ####
ans = [min(data), max(data)]
print(ans)
#### end ####

T6 数据集的类型

直接输出 d t y p e s dtypes dtypes即可。

python 复制代码
import pandas as pd
pd.set_option('display.max_rows', 1000)
# 读入外部数据
data3 = pd.read_csv('deaths.csv')
#####begin#####
print(data3.dtypes)
#####end######

T7 选择数据集的类型

( A B D ) B B C D ( B C ) B C (ABD)BBCD(BC)BC (ABD)BBCD(BC)BC

相关推荐
文火冰糖的硅基工坊41 分钟前
[嵌入式系统-100]:常见的IoT(物联网)开发板
人工智能·物联网·架构
刘晓倩1 小时前
实战任务二:用扣子空间通过任务提示词制作精美PPT
人工智能
shut up1 小时前
LangChain - 如何使用阿里云百炼平台的Qwen-plus模型构建一个桌面文件查询AI助手 - 超详细
人工智能·python·langchain·智能体
Hy行者勇哥1 小时前
公司全场景运营中 PPT 的类型、功能与作用详解
大数据·人工智能
FIN66682 小时前
昂瑞微:实现精准突破,攻坚射频“卡脖子”难题
前端·人工智能·安全·前端框架·信息与通信
FIN66682 小时前
昂瑞微冲刺科创板:硬科技与资本市场的双向奔赴
前端·人工智能·科技·前端框架·智能
m0_677034352 小时前
机器学习-推荐系统(下)
人工智能·机器学习
XIAO·宝2 小时前
深度学习------专题《神经网络完成手写数字识别》
人工智能·深度学习·神经网络
流年染指悲伤、2 小时前
2024年最新技术趋势分析:AI、前端与后端开发新动向
人工智能·前端开发·后端开发·2024·技术趋势
乐迪信息2 小时前
乐迪信息:基于AI算法的煤矿作业人员安全规范智能监测与预警系统
大数据·人工智能·算法·安全·视觉检测·推荐算法