人工智能训练师三级备考笔记

一、实操

1)通用语法(常见于实操题第一块代码块)

1.读取文件数据或加载数据集等描述时

一般为以下结构:Data=pd.read_文件格式('文件名') 注意:文件名需要用' '框起来,必须要有引号

文件格式有以下内容csv、txt、xlsx、json、html、sql、parquet、sas、spss、stata、hdf5,替代文件格式的位置

2.读取前几行数据

使用.head()方法

head( n ) 方法用于读取前面的 n 行,如果不填参数 n ,默认返回 5 行。

使用句法:print(data.head(n))如果要求返回5行数据,n可不填

3.保存数据到对应文件

使用.to_文件类型方法

例如data.to_csv('文件名.csv',index = False) 即将data中的数据保存到csv格式的文件 文件名.csv文件中

4.删除空值或异常值

使用drop或dropna语法

  • drop 是按 行标签(index)或列标签(columns) 删除整行/整列,你必须告诉它"删掉第几行或第几列"。

  • dropna 是按 缺失值的位置 删除行/列,你只需告诉它"哪一列有缺失就删哪一行",不需要知道具体行号。

  • dropna(subset=['列名']) = "只要这一列缺值就删该行,别的列缺不缺我不管"。

2)实操题看到关键字常用语法

关键字:归一化,标准化,或scaler

看到归一化,标准化,或scaler这些关键字,写如下格式的代码

scaler.fit_transform(datanumerical_features)

其中scaler是抄上文,fit_transform是固定用法,括号里的参数是被标准化的对象,抄前文。

关键字:转换数据类型

看到将什么转换成数据类型时,迅速想到pandas.to_numeric(转换的数据)

类似以下格式

复制代码
df['horsepower'] = pd.to_numeric(df['horsepower'], errors='coerce')

这里我要转换的数据是加载的数据集df中的horsepower列 注:多关注使用的符号例如\[\]和''

关键字:划分为训练集和测试集

看到划分数据集想到train_test_split语法例如以下语句

复制代码
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.2, random_state=42)

这里定义了X为训练集,y为测试集,使用train_test_split语法划分,test_size=0.2代表测试集占比20%

关键字训练模型

如果出现训练模型等关键字,使用 数据.fit(训练集,测试集)例如以下代码

复制代码
pipline.fit(X_train,y_train)

训练pipline数据,使用fit方法训练,训练数据为X_train,y_train

关键字:保存模型

pickle.dump(model,文件名)

文件名为题目命名文件

关键字:预测并保存结果

model.predict(X_test)02

过拟合,欠拟合通用改进点;

1 清洗数据,清洗空值,重复值和异常值。

2 扩充训练样本数,增多训练次数

3 调整特征值,加入和目标值有关的字段,去掉和目标值无关的字段

4 对样本进行标准化处理(凑数)

相关推荐
RainCity4 天前
Java Swing 自定义组件库分享(十二)
java·笔记·后端
LinXunFeng12 天前
Obsidian - 使用 Share Note 分享笔记并自部署
前端·笔记·github
闪闪发亮的小星星16 天前
高斯光以及高斯光公式解释
笔记
cqbzcsq16 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
阿米亚波16 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
自传.16 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding
.千余16 天前
【C++】模板进阶全解:非类型参数|全特化|偏特化|分离编译完全指南
开发语言·c++·笔记·学习·其他
自传.16 天前
尚硅谷 Vibe Coding|第二章 AI编程工具生态 学习笔记
笔记·学习·ai编程·尚硅谷·vibe coding
秋波。未央16 天前
Java Agent 开发 · Day 1 学习笔记(含作业完整标准答案)
java·笔记·学习
中屹指纹浏览器16 天前
2026指纹浏览器字体指纹、字体渲染偏差检测与全维度虚拟字体池搭建方案
经验分享·笔记