机器学习笔记1

1、机器学习算法分类

监督学习:

目标值:类别-分类问题

分类算法:K-近邻算法、贝叶斯分类、决策树和随机森林、逻辑回归

目标值:连续型的数据-回归问题

回归算法:线性回归、岭回归

无监督学习:

目标值:无-无监督学习

算法:聚类 K-means

2、机器学习开发流程

1)获取数据

2)数据处理

3)特征工程

4)机器学习算法训练-模型

5)模型评估

6)应用

3、特征工程-数据集

可用数据集:

1)sklearn自带的

2)kaggle

3)UCI

sklearn数据集

sklearn.datasets

load_*获取小规模数据集

1) sklearn.datasets.load_iris()#加载并返回ying尾花数据集

2) sklearn.datasets.load_boston()#加载返回波斯顿房价数据集

fetch_*获取大规模数据集

1) sklearn.datasets.fetch_20newsgroups(data_home=None,subset='train')

(subset参数:'train'是训练集,'test'是测试集,'all'是全部)

load和fetch返回的数据类型是datasets.base.Bunch(字典格式)

dict["key"]=values

bunch.key=values

数据集的划分

训练集和测试集。

相关推荐
Editor_li1 分钟前
金融文坛期刊投稿发表简介
论文阅读·人工智能·金融
xixixi777772 分钟前
从“联网通行证”到“安全可信根”:AI-eSIM的硬件级安全底座正在重构物联网安全边界
人工智能·安全·ai·重构·大模型·通信
咸甜适中5 分钟前
rust语言学习笔记Trait之Default(默认值)
笔记·学习·rust
智慧医养结合软件开源5 分钟前
可视化管控,赋能高效运营与专业展示
大数据·人工智能·安全·云计算·生活
qcx237 分钟前
RAO 深度解读:当 Agent 学会递归调用自己——推理时扩展的新范式
人工智能·ai·llm·prompt·agent·递归
佳xuan7 分钟前
神经网络解析
人工智能·深度学习·神经网络
清水白石0087 分钟前
从“能装上”到“可复现”:Python 团队如何正确使用 requirements.txt、锁定文件与依赖分组
开发语言·人工智能·python
Agent产品评测局9 分钟前
传统RPAvsAI Agent,制造业生产场景能力对比详解 —— 2026智能制造自动化选型全景盘点
人工智能·ai·chatgpt·自动化·制造
半导体守望者9 分钟前
RF电源架构设计匹配器设计步骤功率放大器拓扑图滤波器设计电路布局设计指南
经验分享·笔记·功能测试·自动化·制造
元智启10 分钟前
企业AI如何开发:从“野生智能体”到“平台化治理”
大数据·人工智能