今天聊聊机器学习(Machine Learning)里面的scikit-learn库,从结构上来说,scikit-learn是一个包,这个包里面有很多模块,每个模块里面提供了各种功能的API,scikitlearn库的多种API是为处理数据准备的,因此,在机器学习的数据分析方面,scikit-learn起到了处理复杂数据的作用.下面,我们来详细聊聊scikit-learn库的用法,先在pycharm关联的解释器里面安装sklearn库,pip install sklearn回车即可.导入库,一般采用from sklearn.模块名 import 函数名.在knn算法里面用的是neighbors模块,根据分类问题还是回归问题选择KNeighborsClassifier还是KNeighborsRegressor.默认k=5,根据实际问题选取,k的取值不宜过大,也不宜过小,否则会极大影响模型在测试集上的效果.特征工程里面的预处理,选择模块preprocessing,然后又是根据归一,回归选择MinMaxScaler,StandardScaler.特征工程里面的模型选取选择model_selection模块,导入train_test_split,这个函数主要是对数据集划分为x_train,x_test,y_train,y_test四个部分,方便在归一化或者是标准化的时候,处理x_train,x_test这两个部分.