机器学习day3

一、距离度量

1.欧氏距离

2.曼哈顿距离

3.切比雪夫距离

4.闵可夫斯基距离

二、特征与处理

1.数据归一化

数据归一化是一种将数据按比例缩放,使之落入一个小的特定区间的过程。

代码实战

运行结果

2.数据标准化

数据标准化是将数据按照其均值和标准差进行缩放的过程。经过标准化处理后,数据的均值为0,标准差为1。

代码实战

运行结果

3.鸢尾花识别案例

1.获取数据集

2.数据基本处理

3.数据预处理

4.模型训练

5.模型评估

6.模型预测
代码实战

相关推荐
南境十里·墨染春水3 小时前
C++传记(面向对象)虚析构函数 纯虚函数 抽象类 final、override关键字
开发语言·c++·笔记·算法
2301_797172754 小时前
基于C++的游戏引擎开发
开发语言·c++·算法
有为少年5 小时前
告别“唯语料论”:用合成抽象数据为大模型开智
人工智能·深度学习·神经网络·算法·机器学习·大模型·预训练
比昨天多敲两行5 小时前
C++ 二叉搜索树
开发语言·c++·算法
Season4505 小时前
C++11之正则表达式使用指南--[正则表达式介绍]|[regex的常用函数等介绍]
c++·算法·正则表达式
Tisfy5 小时前
LeetCode 2839.判断通过操作能否让字符串相等 I:if-else(两两判断)
算法·leetcode·字符串·题解
问好眼5 小时前
《算法竞赛进阶指南》0x04 二分-1.最佳牛围栏
数据结构·c++·算法·二分·信息学奥赛
会编程的土豆5 小时前
【数据结构与算法】优先队列
数据结构·算法
minji...7 小时前
Linux 进程信号(二)信号的保存,sigset_t,sigprocmask,sigpending
linux·运维·服务器·网络·数据结构·c++·算法
罗湖老棍子7 小时前
最大数(信息学奥赛一本通- P1549)(洛谷-P1198)
数据结构·算法·线段树·单点修改 区间求最大值