【Educoder数据挖掘实训】了解数据
开挖
T1 数据集中有多少条数据?
按题目直接输出行数即可
python
import pandas as pd
df = pd.read_csv("deaths.csv")
#### Begin ####
print(df.shape[0])
#### End ####
T2 查看数据中的列名
题目里给了 h e a d head head是看前几列, t a i l tail tail是看后几列。而且我们通过输出 h e a d ( ) head() head()发现会将列名输出。故此我们直接输出 h e a d ( 0 ) head(0) head(0)即可。
python
import pandas as pd
df = pd.read_csv('deaths.csv')
#### begin ####
print(df.head(0))
#### end ####
T3 选择属性的类型
关于数据类型只需要本地输出一下 t y p e type type即可。
python
import pandas as pd
df = pd.read_csv("deaths.csv")
print(df.head())
print(df.values[0][5])
print(df.values[0][2])
print(type(df.values[0][5]))
print(type(df.values[0][2]))
答案: D D C C C B T T DDCCCBTT DDCCCBTT
T4 查看每个属性的类型
扫一遍一个一个输出,看一眼标准输出的格式即可。
python
import pandas as pd
df = pd.read_csv('deaths.csv')
data = pd.DataFrame(df)
data = data.iloc[1,:]
#### begin ####
ans = []
for d in data :
ans.append(type(d))
print(ans)
#### end ####
T5 查看属性的值域
直接输出即可,根据格式可以放在列表里。
python
import pandas as pd
df = pd.read_csv('deaths.csv')
data = pd.DataFrame(df)
data = data.iloc[1:,1]
#### begin ####
ans = [min(data), max(data)]
print(ans)
#### end ####
T6 数据集的类型
直接输出 d t y p e s dtypes dtypes即可。
python
import pandas as pd
pd.set_option('display.max_rows', 1000)
# 读入外部数据
data3 = pd.read_csv('deaths.csv')
#####begin#####
print(data3.dtypes)
#####end######
T7 选择数据集的类型
( A B D ) B B C D ( B C ) B C (ABD)BBCD(BC)BC (ABD)BBCD(BC)BC