机器学习笔记1

1、机器学习算法分类

监督学习:

目标值:类别-分类问题

分类算法:K-近邻算法、贝叶斯分类、决策树和随机森林、逻辑回归

目标值:连续型的数据-回归问题

回归算法:线性回归、岭回归

无监督学习:

目标值:无-无监督学习

算法:聚类 K-means

2、机器学习开发流程

1)获取数据

2)数据处理

3)特征工程

4)机器学习算法训练-模型

5)模型评估

6)应用

3、特征工程-数据集

可用数据集:

1)sklearn自带的

2)kaggle

3)UCI

sklearn数据集

sklearn.datasets

load_*获取小规模数据集

1) sklearn.datasets.load_iris()#加载并返回ying尾花数据集

2) sklearn.datasets.load_boston()#加载返回波斯顿房价数据集

fetch_*获取大规模数据集

1) sklearn.datasets.fetch_20newsgroups(data_home=None,subset='train')

(subset参数:'train'是训练集,'test'是测试集,'all'是全部)

load和fetch返回的数据类型是datasets.base.Bunch(字典格式)

dict["key"]=values

bunch.key=values

数据集的划分

训练集和测试集。

相关推荐
Blossom.1183 分钟前
基于区块链技术的供应链溯源系统:重塑信任与透明度
服务器·网络·人工智能·目标检测·机器学习·计算机视觉·区块链
说私域16 分钟前
O2O电商变现:线上线下相互导流——基于定制开发开源AI智能名片S2B2C商城小程序的研究
人工智能·小程序·开源·零售
xiaohanbao0918 分钟前
day29 python深入探索类装饰器
开发语言·python·学习·机器学习·pandas
白杆杆红伞伞33 分钟前
04_决策树
算法·决策树·机器学习
jackson凌1 小时前
【Java学习笔记】【第一阶段项目实践】房屋出租系统(面向对象版本)
java·笔记·学习
Jamence1 小时前
多模态大语言模型arxiv论文略读(七十六)
人工智能·语言模型·自然语言处理
与火星的孩子对话1 小时前
Unity3D开发AI桌面精灵/宠物系列 【六】 人物模型 语音口型同步 LipSync 、梅尔频谱MFCC技术、支持中英文自定义编辑- 基于 C# 语言开发
人工智能·unity·c#·游戏引擎·宠物·lipsync
Data-Miner1 小时前
35页AI应用PPT《DeepSeek如何赋能职场应用》DeepSeek本地化部署与应用案例合集
人工智能
KangkangLoveNLP1 小时前
Llama:开源的急先锋
人工智能·深度学习·神经网络·算法·机器学习·自然语言处理·llama
白熊1881 小时前
【通用智能体】Serper API 详解:搜索引擎数据获取的核心工具
人工智能·搜索引擎·大模型