支持向量机案例

以下是一个使用支持向量机（SVM）对鸢尾花数据集进行分类的案例：

鸢尾花数据集是一类多重变量分析的数据集，共有四个属性列和一个品种类别列，用于分类的属性包括花萼长度、花萼宽度、花瓣长度、花瓣宽度，类别包括山鸢尾、变色鸢尾和维吉尼亚鸢尾三类。该数据集通常被用于分类算法的测试和验证。

首先导入必要的库，包括用于数据处理的pandas、用于数据分割的train_test_split、支持向量机模型SVC以及用于评估模型的accuracy_score等。

python

复制代码

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

python

复制代码

data = pd.read_csv('iris.csv')

python

复制代码

X = data.iloc[:, :-1]
y = data.iloc[:, -1]

python

复制代码

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

python

复制代码

model = SVC(kernel='linear')

python

复制代码

model.fit(X_train, y_train)

python

复制代码

y_pred = model.predict(X_test)

python

复制代码

accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)

通过上述步骤，我们可以得到支持向量机模型在鸢尾花数据集上的分类准确率。如果准确率较高，说明模型能够较好地对鸢尾花进行分类。同时，还可以进一步分析模型的混淆矩阵、精确率、召回率等指标，以更全面地评估模型的性能。此外，还可以尝试不同的核函数、调整模型的超参数，如惩罚参数C等，来优化模型的性能。