自定义数据集 使用scikit-learn中svm的包实现svm分类

数据集生成:

  • 使用 make_classification 函数生成包含1000个样本的数据集,设置20个特征,其中10个是有信息的特征,类别数为2,通过设置 random_state = 42 保证每次运行生成的数据相同。

数据划分:

  • 使用 train_test_split 函数将生成的数据集划分为训练集和测试集,测试集占比为20%,同样通过 random_state = 42 保证划分的一致性。

SVM模型:

  • 初始化 SVC 类,这里使用线性核函数 kernel='linear' 。还有其他核函数可供选择,如 'rbf' (径向基函数核)、 'poly' (多项式核)等,不同的核函数适用于不同的数据分布。

  • 使用 fit 方法将模型拟合到训练集数据 X_train 和对应的标签 y_train 上。

预测与评估:

  • 使用训练好的模型对测试集 X_test 进行预测,得到预测标签 y_pred 。

  • 使用 accuracy_score 函数计算预测准确率,评估模型在测试集上的性能。

import numpy as np

from sklearn.datasets import make_classification

from sklearn.model_selection import train_test_split

from sklearn.svm import SVC

from sklearn.metrics import accuracy_score

生成自定义数据集

X, y = make_classification(n_samples=1000, n_features=20, n_informative=10, n_classes=2, random_state=42)

划分训练集和测试集

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

初始化并拟合SVM模型

svm_classifier = SVC(kernel='linear')

svm_classifier.fit(X_train, y_train)

预测

y_pred = svm_classifier.predict(X_test)

计算准确率

accuracy = accuracy_score(y_test, y_pred)

print(f"Accuracy of SVM classifier: {accuracy}")

相关推荐
EasonZzzzzzz6 分钟前
计算机视觉——相机标定
人工智能·数码相机·计算机视觉
猿小猴子15 分钟前
主流 AI IDE 之一的 Cursor 介绍
ide·人工智能·cursor
要努力啊啊啊16 分钟前
Reranker + BM25 + FAISS 构建高效的多阶段知识库检索系统一
人工智能·语言模型·自然语言处理·faiss
EasyDSS23 分钟前
国标GB28181设备管理软件EasyGBS远程视频监控方案助力高效安全运营
网络·人工智能
春末的南方城市32 分钟前
港科大&快手提出统一上下文视频编辑 UNIC,各种视频编辑任务一网打尽,还可进行多项任务组合!
人工智能·计算机视觉·stable diffusion·aigc·transformer
叶子2024221 小时前
学习使用YOLO的predict函数使用
人工智能·学习·yolo
dmy1 小时前
n8n内网快速部署
运维·人工智能·程序员
傻啦嘿哟1 小时前
Python 数据分析与可视化实战:从数据清洗到图表呈现
大数据·数据库·人工智能
火星数据-Tina1 小时前
AI数据分析在体育中的应用:技术与实践
人工智能·数据挖掘·数据分析