简单的Scikit-Learn入门示例

以下是一个简单的Scikit-Learn入门示例,该示例使用鸢尾花(Iris)数据集来演示分类问题的基本步骤。这个数据集包含了150个样本,每个样本有四个特征(花萼长度、花萼宽度、花瓣长度、花瓣宽度),以及一个目标变量(花的种类,分为山鸢尾、杂色鸢尾和维吉尼亚鸢尾)。

python 复制代码
# 导入必要的库
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# 加载鸢尾花数据集
iris = load_iris()
X = iris.data  # 特征数据
y = iris.target  # 目标变量(花的种类)

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 数据预处理(可选步骤,这里使用特征缩放)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# 选择并训练模型(这里使用支持向量机SVM)
model = SVC(kernel='linear', C=1, random_state=42)
model.fit(X_train_scaled, y_train)

# 预测测试集结果
y_pred = model.predict(X_test_scaled)

# 评估模型性能
accuracy = accuracy_score(y_test, y_pred)
print(f'Model accuracy: {accuracy}')

在这个示例中,我们首先导入了必要的库,然后加载了鸢尾花数据集。接着,我们使用train_test_split函数将数据集划分为训练集和测试集。然后,我们选择了一个数据预处理方法(特征缩放),并用它处理了训练集和测试集的特征。之后,我们选择了支持向量机(SVM)作为分类器,并使用训练集数据训练了模型。最后,我们用模型对测试集进行了预测,并计算了模型的准确率。

相关推荐
电子科技圈41 分钟前
CXL连接全面赋能AI与车载算力提升,SmartDV CXL全栈IP加速相关芯片设计
人工智能·网络协议·tcp/ip·机器学习·自动驾驶·边缘计算
happyprince1 小时前
17-Hugging Face Transformers之BERT 案例详解:Transformers 框架全模块串联
人工智能·深度学习·bert
日光明媚1 小时前
从代码的角度解读DMD2
人工智能·深度学习·机器学习·stable diffusion·aigc
weixin_468466851 小时前
UNet 模型结构从零搭建与实战解析
人工智能·深度学习·算法·机器学习·ai·unet
扫地僧9851 小时前
Tyche :医学图像分割中的随机上下文学习
人工智能·机器学习·计算机视觉
搞科研的小刘选手1 小时前
【西安交通大学主办】第六届人工智能、自动化与高性能计算国际会议 (AIAHPC 2026)
网络·人工智能·机器学习·数据挖掘·自动化·云计算·并行式
装不满的克莱因瓶2 小时前
基于 Python 进行二维空间线性可分数据单/多层感知器实战
人工智能·python·深度学习·神经网络·ai·卷积
keyanbanyungong2 小时前
没预实验怎么申课题?
人工智能·深度学习
段一凡-华北理工大学2 小时前
工业领域的Hadoop架构学习~系列文章15:机器学习与大数据融合 - 工业智能的算法引擎
大数据·人工智能·hadoop·机器学习·架构·工业智能体·高炉炼铁智能化
一楼的猫2 小时前
AI辅助长篇小说创作的“记忆崩坏“问题与结构管理策略
人工智能·学习·机器学习·chatgpt·ai作画·ai写作