机器学习库Scikit-Learn

Scikit-Learn是Python下强大的机器学习工具包,它提供了完善的机器学习工具箱,包括数据预处理、分类、回归聚类、预测和模型分析等。

Scikit-Learn 依赖于NumPy、SciPy和 Matplotlib,因此,只需要提前安装好这几个库然后安装 Scikit-Lean,安装代码:

python 复制代码
pip install scikit-learn

创建一个线性回归示例:

python 复制代码
from sklearn.linear_model import LinearRegression #导入线性回归模型
model=LinearRegression()#建立线性回归模型
print(model)

model.fit():训练模型,对于监督模型来说是 fit(X,y),对于非监督模型是 fit(X)。

监督模型提供的接口有:

model.predict(X_new):预测新样本

model.predict_proba(X_new):预测概率,仅对某些模型有用(比如LR)

model.score():得分越高,fit越好

非监督模型提供的接口有:

model.transform():从数据中学到新的"基空间"

model.fit_transform():从数据中学到新的基并将这个

据按照这组"基"进行转换

这个库有内置数据集,比如常见的鸢尾花数据,有一百五十个鸢尾花的一些尺寸的观测值:尊片长

度、宽度,花瓣长度和宽度。还有它们的亚属:山鸢尾(Iris setosa)、变色鸢尾(Iris versicolor)和维吉

尼亚鸢尾(Iris virginica)。

下面导入鸢尾花的数据,建立线性SVM模型,对其分类,预测,并查看模型参数代码如下:

python 复制代码
from sklearn import datasets#导入数据集
Iris=datasets.load_iris()#加载鸢尾花数据集
print(Iris.data.shape)#查看数据集大小
from sklearn import svm #导入SVM模型
clf=svm.LinearSVC()#建立线性SVM分类器
clf.fit(Iris.data,Iris.target)#用数据训练模型
clf.predict([[5.0,3.6,1.3,0.25]])#训练好模型之后,输入新的数据进行预测
#查看训练好模型的参数
clf.coef_

运行结果如下:

更多资料参考:scikit-learn: machine learning in Python --- scikit-learn 1.4.1 documentation

相关推荐
LgZhu(Yanker)2 小时前
27、企业维修保养(M&R)全流程管理:从预防性维护到智能运维的进阶之路
大数据·运维·人工智能·erp·设备·维修·保养
ModelWhale3 小时前
“大模型”技术专栏 | 和鲸 AI Infra 架构总监朱天琦:大模型微调与蒸馏技术的全景分析与实践指南(上)
人工智能·大模型·大语言模型
lxmyzzs4 小时前
【图像算法 - 08】基于 YOLO11 的抽烟检测系统(包含环境搭建 + 数据集处理 + 模型训练 + 效果对比 + 调参技巧)
人工智能·yolo·目标检测·计算机视觉
霖005 小时前
ZYNQ实现FFT信号处理项目
人工智能·经验分享·神经网络·机器学习·fpga开发·信号处理
GIS数据转换器5 小时前
AI 技术在智慧城市建设中的融合应用
大数据·人工智能·机器学习·计算机视觉·系统架构·智慧城市
竹子_235 小时前
《零基础入门AI:传统机器学习进阶(从拟合概念到K-Means算法)》
人工智能·算法·机器学习
上海云盾-高防顾问5 小时前
DDoS 防护的未来趋势:AI 如何重塑安全行业?
人工智能·安全·ddos
Godspeed Zhao5 小时前
自动驾驶中的传感器技术17——Camera(8)
人工智能·机器学习·自动驾驶·camera·cis
2401_831896036 小时前
机器学习(6):决策树-分类
决策树·机器学习·分类
摆烂工程师6 小时前
GPT-5 即将凌晨1点进行发布,免费用户可以使用 GPT-5
前端·人工智能·程序员