机器学习笔记1

1、机器学习算法分类

监督学习:

目标值:类别-分类问题

分类算法:K-近邻算法、贝叶斯分类、决策树和随机森林、逻辑回归

目标值:连续型的数据-回归问题

回归算法:线性回归、岭回归

无监督学习:

目标值:无-无监督学习

算法:聚类 K-means

2、机器学习开发流程

1)获取数据

2)数据处理

3)特征工程

4)机器学习算法训练-模型

5)模型评估

6)应用

3、特征工程-数据集

可用数据集:

1)sklearn自带的

2)kaggle

3)UCI

sklearn数据集

sklearn.datasets

load_*获取小规模数据集

1) sklearn.datasets.load_iris()#加载并返回ying尾花数据集

2) sklearn.datasets.load_boston()#加载返回波斯顿房价数据集

fetch_*获取大规模数据集

1) sklearn.datasets.fetch_20newsgroups(data_home=None,subset='train')

(subset参数:'train'是训练集,'test'是测试集,'all'是全部)

load和fetch返回的数据类型是datasets.base.Bunch(字典格式)

dict["key"]=values

bunch.key=values

数据集的划分

训练集和测试集。

相关推荐
Sui_Network17 分钟前
备受期待的 POP 射击游戏 XOCIETY 正式在 Epic Games Store 开启体验
人工智能·游戏·rpc·区块链·量子计算·graphql
漫长的~以后30 分钟前
GPT-5.2深度拆解:多档位自适应架构如何重塑AI推理效率
人工智能·gpt·架构
爱笑的眼睛1135 分钟前
自动机器学习组件的深度解析:超越AutoML框架的底层架构
java·人工智能·python·ai
LCG米38 分钟前
嵌入式Python工业环境监测实战:MicroPython读取多传感器数据
开发语言·人工智能·python
思成不止于此1 小时前
【MySQL 零基础入门】MySQL 函数精讲(二):日期函数与流程控制函数篇
android·数据库·笔记·sql·学习·mysql
努力的BigJiang1 小时前
Cube-slam复现及报错解决
人工智能
ComputerInBook1 小时前
代数基本概念理解——特征向量和特征值
人工智能·算法·机器学习·线性变换·特征值·特征向量
中屹指纹浏览器1 小时前
2025技术干货:国内静态 IP 搭配指纹浏览器的加密绑定与跨区域优化方案
经验分享·笔记
漫长的~以后1 小时前
Edge TPU LiteRT V2拆解:1GB内存设备也能流畅跑AI的底层逻辑
前端·人工智能·edge
星火10241 小时前
“重生”之我用 Solo 写了一盘中国象棋
人工智能·ai编程