自定义数据集 使用scikit-learn中SVM的包实现SVM分类

生成自定义数据集

生成一个简单的二维数据集,包含两类数据点,分别用不同的标签表示。

python 复制代码
import numpy as np
import matplotlib.pyplot as plt

# 生成数据
np.random.seed(42)
X = np.r_[np.random.randn(100, 2) - [2, 2], np.random.randn(100, 2) + [2, 2]]
y = [0] * 100 + [1] * 100

# 可视化数据
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Paired)
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.title('Custom Dataset')
plt.show()
使用SVM进行分类

接下来,使用scikit-learn中的SVC类来实现SVM分类。

python 复制代码
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 创建SVM分类器
clf = SVC(kernel='linear', C=1.0)

# 训练模型
clf.fit(X_train, y_train)

# 预测
y_pred = clf.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print(f'Accuracy: {accuracy:.2f}')
可视化分类结果

为了更直观地查看SVM分类的效果,可以绘制决策边界。

python 复制代码
# 绘制决策边界
def plot_decision_boundary(clf, X, y):
    x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1
    xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.01),
                         np.arange(y_min, y_max, 0.01))
    Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    plt.contourf(xx, yy, Z, alpha=0.8, cmap=plt.cm.Paired)
    plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Paired, edgecolor='k')
    plt.xlabel('Feature 1')
    plt.ylabel('Feature 2')
    plt.title('SVM Decision Boundary')
    plt.show()

# 绘制决策边界
plot_decision_boundary(clf, X_test, y_test)
相关推荐
森诺Alyson13 小时前
前沿技术借鉴研讨-2026.5.28(眼动数据预测抑郁&自杀倾向)
论文阅读·人工智能·深度学习·分类·论文笔记
Ricky055318 小时前
YOLO-FCE:一种基于特征与聚类增强的物种分类目标检测模型(澳大利亚2026年研究)
图像处理·人工智能·yolo·目标检测·分类
l143723326719 小时前
跨语种配音中的情感保留:从情绪分类到细粒度副语言还原的技术实现
人工智能·分类·数据挖掘
listhi52019 小时前
基于MATLAB的自适应粒子群算法(APSO)实现大规模分类特征选择
算法·matlab·分类
IT北辰20 小时前
树形层级数据平铺术:用 Python 将分类父子表展开为全路径宽表
大数据·python·分类
Dontla21 小时前
IVFFlat索引上下文中聚类介绍(将相似向量分到同一组,称为“簇”,使得组内向量彼此相似(例如用余弦相似度衡量),组间向量差异较大)ANN近似最近邻
机器学习·支持向量机·聚类
AI算法沐枫21 小时前
机器学习经典小项目1:鸢尾花分类
人工智能·pytorch·深度学习·神经网络·机器学习·分类·数据挖掘
今天吃饺子2 天前
50种近五年主流深度学习模型×10种时频方法,故障诊断、分类一键跑通!
人工智能·深度学习·机器学习·分类·数据挖掘
机器学习之心2 天前
Stacking集成学习回归预测:PLS+SVM+BP+RF+LSTM
支持向量机·回归·集成学习·stacking
皇儒无上3 天前
支持向量机(SVM)解析:原理、关联、场景与代码
机器学习·支持向量机