机器学习笔记1

1、机器学习算法分类

监督学习:

目标值:类别-分类问题

分类算法:K-近邻算法、贝叶斯分类、决策树和随机森林、逻辑回归

目标值:连续型的数据-回归问题

回归算法:线性回归、岭回归

无监督学习:

目标值:无-无监督学习

算法:聚类 K-means

2、机器学习开发流程

1)获取数据

2)数据处理

3)特征工程

4)机器学习算法训练-模型

5)模型评估

6)应用

3、特征工程-数据集

可用数据集:

1)sklearn自带的

2)kaggle

3)UCI

sklearn数据集

sklearn.datasets

load_*获取小规模数据集

1) sklearn.datasets.load_iris()#加载并返回ying尾花数据集

2) sklearn.datasets.load_boston()#加载返回波斯顿房价数据集

fetch_*获取大规模数据集

1) sklearn.datasets.fetch_20newsgroups(data_home=None,subset='train')

(subset参数:'train'是训练集,'test'是测试集,'all'是全部)

load和fetch返回的数据类型是datasets.base.Bunch(字典格式)

dict["key"]=values

bunch.key=values

数据集的划分

训练集和测试集。

相关推荐
牛奶28 分钟前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶30 分钟前
前端人为什么要学AI?
前端·人工智能·ai编程
哥布林学者2 小时前
高光谱成像(一)高光谱图像
机器学习·高光谱成像
罗西的思考3 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab4 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab4 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸5 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云6 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny8656 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔6 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能