分类算法——sklearn转换器和估计器(一)

转换器(特征工程的父类)

  • 实例化(实例化的是一个转换器类(Transformer))
  • 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)

把特征工程的接口称之为转换器,其中转换器调用有这么几种形式:

标准化:(X- mean) / std

  • fit_transform( )
  • fit()------计算每一列的平均值、标准差
  • transform()------(X- mean) /std进行最终的转换
bash 复制代码
In [1] : from sklearn.preprocessing import StandardScaler
In [2] : std1=StandardScaler()
In [3] : a=[[1,2,3],[4,5,6]]
In [4] : std1.ft_transform( a)
out [4] :
array ([[-1.,-1.,-1.],
	   [1.,1.,1.]])
	   
In [5] : std2=StandardScaler()
In [6] : std2.fit(a)
out[6] : StandardScaler(copy=True,with_mean=True,with_std=True)

In [7] : std2.transform(a)
out[7] :
array([[-1.,-1.,-1.],
	  [1.,1.,1.]])

从中可以看出,fit_transform的作用相当于transform加上fit。

bash 复制代码
In [8] : b=[[7,8,9],[10,11,12]]
In [9] : std2.transform(b)
out [9] :
array([[3.,3.,3.],
	  [5., 5.,5.]])
	  
In [10] : std2.fit_transform(b)
out [10] :
array([[-1.,-1.,-1.],
	  [1.,1.,1.]])

估计器(sklearn机器学习算法的实现)

在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API

  • 1用于分类的估计器:
    • sklearn.neighbors k-近邻算法
    • sklearn.naive_bayes 贝叶斯
    • sklearn.linear_model.LogisticRegression 逻辑回归
    • sklearn.tree 决策树与随机森林
  • 2用于回归的估计器:
    • sklearn.linear_model.LinearRegression 线性回归
    • sklearn.linear_model.Ridge 岭回归
  • 3用于无监督学习的估计器:
    • sklearn.cluster.KMeans 聚类

估计器工作流程

  • 实例化一个estimator
  • estimator.fit(x train, y train) 计算
    一调用完毕,模型生成
  • 3模型评估:
    • ①直接比对真实值和预测值
      y_predict = estimator. predict(x_test)
      y_test == y_predict
    • ②计算准确率
      accuracy = estimator.score(x_test, y_test)
相关推荐
AI生成网页工具2 小时前
2026年北京本地企业级AI提效解决方案提供商推荐名单与专业对比
数据挖掘
人工智能AI酱3 小时前
【AI深究】高斯混合模型(GMM)全网最详细全流程详解与案例(附Python代码演示) | 混合模型概率密度函数、多元高斯分布概率密度函数、期望最大化(EM)算法 | 实际案例与流程 | 优、缺点分析
人工智能·python·算法·机器学习·分类·回归·聚类
Lun3866buzha8 小时前
机械零件识别与分类_基于YOLO11-seg的六角螺栓、方颈螺栓、六角螺母、弹性卡环、弹簧锁紧垫片和平垫片自动检测与识别_DRB_1
人工智能·分类·数据挖掘
海天一色y9 小时前
使用BEiT模型进行CIFAR-100图像分类:迁移学习实战指南
分类·数据挖掘·迁移学习
Lun3866buzha9 小时前
法兰盘表面缺陷识别与分类:基于YOLO13-C3k2-RFAConv的智能检测系统完整实现
人工智能·分类·数据挖掘
Liue612312319 小时前
基于YOLO11-CARAFE的手指区域识别与标注分类方法研究
人工智能·分类·数据挖掘
简简单单做算法10 小时前
基于LSTM长短记忆网络模型的文本分类算法matlab仿真,对比GRU网络
matlab·分类·gru·lstm·文本分类
babe小鑫10 小时前
高职商务数据分析与应用专业学习数据分析的重要性
学习·数据挖掘·数据分析
AI科技星11 小时前
光速为何是宇宙的终极速度极限?
人工智能·线性代数·算法·矩阵·数据挖掘
YangYang9YangYan11 小时前
2026中专大数据管理与应用专业学数据分析的技术价值分析
数据挖掘·数据分析