scikit-learn零基础配置(含python、anaconda)

一、Anaconda环境搭建

1、关于Anaconda

Anaconda 是一个非常 popular 的 Python 发行版,它不仅包含了 Python 语言本身,还预装了众多常用的科学计算库,如 NumPy、Pandas、Matplotlib 等,能够极大地方便用户的开发和数据分析工作。Anaconda 提供了一个统一的环境管理工具,用户可以轻松创建和管理多个独立的 Python 环境,避免了不同项目之间的依赖冲突。此外,Anaconda 还提供了 Anaconda Navigator 这样的图形化界面,让用户更直观地管理包和环境。这对于刚开始学习 Python 或者需要处理复杂项目的用户来说,Anaconda 都是一个非常友好且强大的工具。

很多人在使用Python时,直接就下载了特定版本的Python解释器,然后项目中途会使用到的哪些库,直接安装就行了,这样会带来一些问题:

不同项目使用的库对Python的版本也许会有限制。比如有些库只能在Python2的版本下使用,有的只能在Python3的版本下使用;很多库在一次或者几次的项目中使用后,就很难再用到了,长期下来会积累很多这种已经没用的库,从而使包变得冗余,占用内存空间。

针对直接安装Python会带来的这些问题,所以很多人都会使用anaconda,anaconda有以下好处:自带常用的库,能够满足一些基础简单的需要;可以创建多个环境,每个环境可以安装不同的Python版本,从而解决了版本冲突的问题。并且每个环境都可独立安装各自需要的库,应用于不同的项目,由此便于管理不同项目需要的特定的库。

2、Anaconda下载

(1)下载Anaconda安装包

进入 Anaconda 官网,注册或登录,在 Hub 中点击 Install Distribution,填写信息后下载即可。

如果你的网络无法访问 Anaconda 官网或者下载速度较慢,可以从 清华大学开源软件镜像站 下载。或者直接使用我在群内提供的压缩包下载。

(2)安装Anaconda

在 Anaconda 安装的过程中,比较容易出错的环节是环境变量的配置,所以大家在配置环境变量的时候,要细心一些。

双击下载好的安装包,点击 Next ,点击 I Agree ,选择 Just Me,选择安装路经(安装在 C 盘也有好处,不过与 C 盘爆炸来说不值一提,建议按在其他盘)然后 Next,来到如下界面:

请选择 Register Anaconda as my default Python 3.x,不要选 Add Anaconda to my PATH environment variable,我们需要后期手动添加环境变量。

点击 Install,安装需要等待一会儿。

最后一直 Next,直到安装完成。

对于两个"learn",都取消打勾,不用打开去看了,耽误时间。

(3)配置环境变量

此电脑(右键)→ 属性 → 高级系统设置 →(点击)环境变量

在下面系统变量里,找到并点击 Path

在编辑环境变量里,点击新建

输入下面的五个环境变量。(这里不是完全一样的!你需要将以下五条环境变量中涉及的到的"D:\_Producers\Anaconda3"都修改为你的 Anaconda 的安装路径!

复制代码
E:\environment\anaconda3
E:\environment\Anaconda3\Scripts
E:\environment\Anaconda3\Library\bin
E:\environment\Anaconda3\Library\mingw-w64\bin
E:\environment\Anaconda3\Library\usr\bin

简要说明五条路径的用途:这五个环境变量中,1 是 Python 需要,2 是 conda 自带脚本,3 是 jupyter notebook 动态库, 4 是使用 C with python 的时候

新建完成后点击确定。

(4)验证

打开 cmd,在弹出的命令行查看 anaconda 版本,依次输入 :

复制代码
conda --version
python --version

若各自出现版本号,即代表配置成功。

在开始菜单或桌面找到 Anaconda Navifator 将其打开(若桌面没有可以发一份到桌面,方便后续使用),出现 GUI 界面即为安装成功。

Anaconda 自带了一些常用的机器学习库,如 numpy、pandas、matplotlib、seaborn、scikit-learn 等。

如果需要安装其他库,可以直接在 Anaconda Navigator 里搜索安装。

(5)更改conda源

如果你没有魔法上网工具,建议更改 conda 源,这样可以加快下载包的速度。清华大学提供了 Anaconda 的镜像仓库,我们把源改为清华大学镜像源。

找到 Anaconda prompt,打开 shell 面板。

在命令行输入以下命令:

复制代码
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --set show_channel_urls yes

查看是否修改好通道:

复制代码
conda config --show channels

二、PyCharm使用

1、新建项目

2、配置conda环境

(1)我们在PyCharm中依此选择File-->Settings-->Project-->Python Inerpreter,如下图所示:

(2)在弹出的设置窗口中,点击左侧的"Python Inerpreter",然后点击右侧的"Add Local Interpreter",点击它进到环境配置窗口:

(3)点击conda environment选项卡,点击右侧文件夹图标,找到自己anaconda下载的目录,选择anaconda根目录下的Scripts下的conda.exe。

(4)然后点击"Load Environment"加载环境,加载完成后发现所有虚拟环境均导入,默认为base环境。

(5)我们可以看到base环境的包,含有scikit-learn库,说明此时编译器可以进行sickit-learn库提供的相关操作。

(6)验证是否配置成功,新建一个py文件,将下面的代码放进文件运行,若控制台正常运行出结果证明配置成功。

复制代码
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier

# 1.获取数据
iris = load_iris()

# 2.数据基本处理
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)

# 3.特征工程 - 特征预处理
transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)
x_test = transfer.transform(x_test)

# 4.机器学习-KNN
# 4.1 实例化一个估计器
estimator = KNeighborsClassifier()
# 4.2 模型调优 -- 交叉验证,网格搜索
param_grid = {"n_neighbors": [1, 3, 5, 7]}
estimator = GridSearchCV(estimator, param_grid=param_grid, cv=5)
# 4.3 模型训练
estimator.fit(x_train, y_train)

# 5.模型评估
# 5.1 预测值结果输出
y_pre = estimator.predict(x_test)
print("预测值是:\n", y_pre)
print("预测值和真实值的对比是:\n", y_pre == y_test)
# 5.2 准确率计算
score = estimator.score(x_test, y_test)
print("准确率为:\n", score)
# 5.3 查看交叉验证,网格搜索的一些属性
print("在交叉验证中,得到的最好结果是:\n", estimator.best_score_)
print("在交叉验证中,得到的最好的模型是:\n", estimator.best_estimator_)
print("在交叉验证中,得到的模型结果是:\n", estimator.cv_results_)

print("Hello, sklearn!")

三、常用Anaconda指令

在没有 GUI 的情况下,以下命令比较常用:

1.查看当前环境下安装的库:

复制代码
conda list

2.查看所有环境:

复制代码
conda info --envs

3.创建新的环境:

复制代码
conda create -n 环境名称 python=版本号

4.激活环境:

复制代码
conda activate 环境名称

5.退出环境:

复制代码
conda deactivate

6.删除环境:

复制代码
conda remove -n 环境名称 --all

7.导出环境:

复制代码
conda env export > environment.yaml

8.导入环境:

复制代码
conda env create -f environment.yaml

9.列出所有可用的包:

复制代码
conda search 包名

10.安装包:

复制代码
conda install 包名

11.更新包:

复制代码
conda update 包名

12.卸载包:

复制代码
conda uninstall 包名
相关推荐
Java水解3 小时前
Python数据库操作:SQLAlchemy ORM指南
python
悠哉悠哉愿意3 小时前
【数学建模学习笔记】无监督聚类模型:分层聚类
笔记·python·学习·数学建模
eleqi3 小时前
Python+DRVT 从外部调用 Revit:批量创建门
python·系统集成·bim·revit·drvt·自动生产流水线
先做个垃圾出来………4 小时前
PyTorch 模型文件介绍
人工智能·pytorch·python
浅醉樱花雨4 小时前
vosk语音识别实战
人工智能·python·语音识别·asr·vosk
xz2024102****4 小时前
最大似然估计:损失函数的底层数学原理
人工智能·算法·机器学习·概率论
再努力"亿"点点4 小时前
爬取m3u8视频完整教程
开发语言·python
悟能不能悟4 小时前
if __name__=‘__main__‘的用处
python
Source.Liu4 小时前
【Python基础】 15 Rust 与 Python 基本类型对比笔记
笔记·python·rust