支持向量机(iris)

代码:

python 复制代码
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn import svm
import numpy as np

# 定义每一列的属性
colnames = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']
# 读取数据
iris = pd.read_csv('data\\iris.data', names=colnames)

# iris.head()是一个pandas库中的函数,用于显示数据集的前几行。默认情况下,它显示前5行数据。
"""
   sepal-length  sepal-width  petal-length  petal-width        class
0           5.1          3.5           1.4          0.2  Iris-setosa
1           4.9          3.0           1.4          0.2  Iris-setosa
2           4.7          3.2           1.3          0.2  Iris-setosa
3           4.6          3.1           1.5          0.2  Iris-setosa
4           5.0          3.6           1.4          0.2  Iris-setosa
"""
iris.head()

# drop():删除行或列
X = iris.drop('class', axis=1)  # 属性值
y = iris['class']   # 类别

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

clf = svm.SVC(kernel='linear')
clf.fit(X_scaled, y)

# 随机生成3组测试数据,注意需要归一化处理
test_data = scaler.transform(np.array([[5.1, 3.5, 1.4, 0.2], [6.7, 3.1, 4.7, 1.5], [7.9, 3.8, 6.4, 2.0]]))

# 获得模型预测结果
pred = clf.predict(test_data)

print(pred)

对代码的解释:

因为iris.data中是这样的:

即前4列为属性,第5列为类别

定义属性与类别:

python 复制代码
# 定义每一列的属性
colnames = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']

读取数据,并给数据加上colnames:

python 复制代码
# 读取数据
iris = pd.read_csv('data\\iris.data', names=colnames)

print输出一下iris:

对于read_csv()方法:

(4条消息) 详解pandas的read_csv方法_小尛玮的博客-CSDN博客

对于head()函数:

python 复制代码
# iris.head()是一个pandas库中的函数,用于显示数据集的前几行。默认情况下,它显示前5行数据。
"""
   sepal-length  sepal-width  petal-length  petal-width        class
0           5.1          3.5           1.4          0.2  Iris-setosa
1           4.9          3.0           1.4          0.2  Iris-setosa
2           4.7          3.2           1.3          0.2  Iris-setosa
3           4.6          3.1           1.5          0.2  Iris-setosa
4           5.0          3.6           1.4          0.2  Iris-setosa
"""
iris.head()

对于drop()函数:

(3条消息) Pandas基本数据交互机制2-drop()方法_朱错错的哒哒哒的博客-CSDN博客

python 复制代码
# drop():删除行或列
X = iris.drop('class', axis=1)  # 属性值

'class':去掉属性为class的一行或一列

axis=1:去掉某一行,加上参数axis就是去掉某一列

这行代码的返回值为去掉属性为class的那一列之后的数据集,即所有属性

python 复制代码
y = iris['class']   # 类别

这行代码返回值为类别那一列

对于StandardScaler()方法与fit_transform方法

(3条消息) sklearn中StandardScaler()_汽水配辣条的博客-CSDN博客

python 复制代码
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

对于svm()方法

(3条消息) 【机器学习】svm.SVC参数详解_svm.svc中的参数以及作用_Xhfei1224的博客-CSDN博客

python 复制代码
clf = svm.SVC(kernel='linear')
clf.fit(X_scaled, y)

预测

python 复制代码
# 随机生成3组测试数据,注意需要归一化处理
test_data = scaler.transform(np.array([[5.1, 3.5, 1.4, 0.2], [6.7, 3.1, 4.7, 1.5], [7.9, 3.8, 6.4, 2.0]]))

# 获得模型预测结果
pred = clf.predict(test_data)

print(pred)
相关推荐
刘大猫.1 小时前
宇树科技回应联合英伟达开发“H2+”人形机器人,预计今年下半年正式亮相
人工智能·科技·机器学习·ai·chatgpt·机器人·大模型
Hali_Botebie1 小时前
变分推断(Variational Inference, VI)数学角度,以及结合神经网络的形式
人工智能·神经网络·机器学习
SilentSamsara2 小时前
特征工程系统方法论:编码、分箱、交互特征与特征选择
开发语言·人工智能·python·机器学习·青少年编程·信息可视化·pandas
ZHW_AI课题组2 小时前
腾讯云驾车路线规划实现 —— 从 API 调用到代码解析的深度实践
人工智能·机器学习·信息可视化
暖阳华笺2 小时前
【高频考点】K-Means聚类算法
c++·算法·机器学习·kmeans·聚类
apcipot_rain3 小时前
计科八股20260609——10分钟速通《线性代数》,知识点极简版
人工智能·线性代数·机器学习
SilentSamsara3 小时前
模型评估与超参调优:交叉验证、Optuna 与模型选择策略
人工智能·python·深度学习·机器学习·青少年编程
叫我:松哥3 小时前
基于LSTM与ARIMA的城市空气质量分析与预测系统
人工智能·python·rnn·算法·机器学习·flask·lstm
搞科研的小刘选手3 小时前
【国家电网省科学研究院支持】第七届物联网、人工智能与电气能源国际学术会议(IoTAIEE 2026)
人工智能·物联网·机器学习·计算机视觉·自动化·能源·电气
mightbxg3 小时前
【学习一下】余弦相似度+Sigmoid+交叉熵组合
深度学习·学习·机器学习