机器学习笔记1

1、机器学习算法分类

监督学习:

目标值:类别-分类问题

分类算法:K-近邻算法、贝叶斯分类、决策树和随机森林、逻辑回归

目标值:连续型的数据-回归问题

回归算法:线性回归、岭回归

无监督学习:

目标值:无-无监督学习

算法:聚类 K-means

2、机器学习开发流程

1)获取数据

2)数据处理

3)特征工程

4)机器学习算法训练-模型

5)模型评估

6)应用

3、特征工程-数据集

可用数据集:

1)sklearn自带的

2)kaggle

3)UCI

sklearn数据集

sklearn.datasets

load_*获取小规模数据集

1) sklearn.datasets.load_iris()#加载并返回ying尾花数据集

2) sklearn.datasets.load_boston()#加载返回波斯顿房价数据集

fetch_*获取大规模数据集

1) sklearn.datasets.fetch_20newsgroups(data_home=None,subset='train')

(subset参数:'train'是训练集,'test'是测试集,'all'是全部)

load和fetch返回的数据类型是datasets.base.Bunch(字典格式)

dict["key"]=values

bunch.key=values

数据集的划分

训练集和测试集。

相关推荐
芯盾时代1 小时前
安全大模型智驱网络和数据安全效能跃迁
网络·人工智能·安全·网络安全
彩讯股份3006342 小时前
打造多模态交互新范式|彩讯股份中标2025年中国移动和留言平台AI智能体研发项目
人工智能
思通数科大数据舆情2 小时前
工业安全零事故的智能守护者:一体化AI智能安防平台
人工智能·安全·目标检测·计算机视觉·目标跟踪·数据挖掘·知识图谱
AI360labs_atyun3 小时前
2025 高考:AI 都在哪些地方发挥了作用
人工智能·科技·ai·高考
AgilityBaby3 小时前
Unity实现不倒翁
笔记·unity·c#·游戏引擎
Yxh181377845544 小时前
短视频矩阵系统技术saas源头6年开发构架
人工智能·矩阵
m0_634448894 小时前
图上合成:用于大型语言模型持续预训练的知识合成数据生成
人工智能·语言模型·自然语言处理
Studying 开龙wu5 小时前
机器学习监督学习实战五:六种算法对声呐回波信号进行分类
学习·算法·机器学习
张较瘦_5 小时前
[论文阅读] 人工智能 | 利用负信号蒸馏:用REDI框架提升LLM推理能力
论文阅读·人工智能
dexi.Chi 攻城狮5 小时前
如何根据excel表生成sql的insert脚本
经验分享·笔记