数据科学与智能分析基础--开发环境配置

数据科学与智能分析基础

开发环境配置

Anaconda与Miniconda介绍

Anaconda指的是一个非常强大的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。因为包含了大量的科学包,Anaconda 的下载文件比较大,如果只需要某些包,或者需要节省带宽或存储空间,也可以使用Miniconda这个较小的发行版(仅包含conda和 Python)

conda是一个开源的包、环境管理器,可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换

下载

Miniconda下载地址

Index of /miniconda

Index of /anaconda/miniconda/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

安装

1:点击next

确认安装是否完成,通过PowerShell查看

Conda虚拟环境

​  Python 应用经常需要使用一些包第三方包或者模块,有时需要依赖特定的包或者库的版本,所以不能有一个能适应所有 Python 应用的软件环境

很多时候不同的 Python 应用所依赖的版本是冲突的,满足了其中一个,另一个则无法运行,解决这一问题的方法是虚拟环境

虚拟环境是一个包含了特定 Python 解析器以及一些软件包,不同的应用程序可以使用不同的虚拟环境,从而解决了依赖冲突问题,而且虚拟环境中只需要安装应用相关的包或者模块,可以给部署提供便利。

建议:

如果使用anaconda进行多个项目开发,最好创建不同的虚拟环境,也就是为每个项目配置独立的虚拟环境,使得彼此之间不会受到任何干扰。

Anaconda虚拟环境命令

  • 显示已存在虚拟环境
python 复制代码
conda info --envs
  • 创建虚拟环境
python 复制代码
conda create -n 虚拟环境名称 python=版本号
  • 删除虚拟环境
python 复制代码
conda remove -n 虚拟环境名称 --all
  • 激活\进入虚拟环境
python 复制代码
conda activate 虚拟环境名称
  • 退出虚拟环境
python 复制代码
conda deactivate 虚拟环境名称

说明:

  • 创建虚拟环境后,默认会在Anaconda安装目录的envs下,
  • 创建虚拟环境相关文件
  • 创建的虚拟环境仅安装一些必须软件包,例如pip等。如果需要安装Anaconda所有库,需要使用如下命令:
py 复制代码
conda create -n 虚拟环境名称 python=版本号anaconda

显示虚拟环境:

PowerShell无法激活虚拟环境

问题:

在使用PowerShell激活虚拟环境时,发现激活无效,而在CMD中可以

解决方案

  • 检查是否是执行脚本的权限,或者直接开启权限,使用管理员权限下,执行命令: SetExecutionPolicy RemoteSigned ,输入Y即可
  • 必须将Anaconda 写入环境变量。使用管理员权限下,执行命令: conda init powershell
  • Conda版本小于4.6,编写命令不加conda命令: activate 环境名 , 大于4.6使用 conda activate环境名
  • 修改完后,重启下powershell

PowerShell显示虚拟环境名称

在终端输入 conda config --set auto_activate_base false ,即可

如果又反悔了,想显示了,可以使用如下命令:

conda config --set auto_activate_base true

Conda软件模块的管理

conda是一个软件的管理器,可用来下载、删除Python的软件包(与pip有些类似)

  • 安装:conda install 软件/模块
  • 卸载:conda remove 软件/模块
  • 查看:conda list

pip管理

  • 安装:pip install 软件/模块
  • 卸载:pip uninstall 软件/模块
  • 查看:pip list

conda 对比 pip

conda在安装包时会同时处理所有依赖关系,包括

  • Python解释器版本
  • C/C++库
  • CUDA等硬件相关的依赖
  • 其他编程语言的依赖

conda使用严格的依赖解析器,可以预先检查所有依赖冲突

pip只管理Python包,不管理系统级别的依赖

数据源与路径设置

需要掌握点

  • 设置虚拟环境目录
  • 设置下载软件的数据源
  • 设置缓存目录

配置文件

Linux用户可以通过修改用户目录下的 .condarc 文件

Windows 用户无法直接创建名为 .condarc 的文件,可先执行 condaconfig 生成该文件之后再修改

清华大学开源软件镜像站 https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/

python 复制代码
channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

命令

conda数据源

python 复制代码
conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge

conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/

pip数据源

python 复制代码
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

设置虚拟环境目录:

python 复制代码
envs_dirs:
 - D:\miniconda3\envs

设置缓存软件目录:

python 复制代码
pkgs_dirs:
 - D:\miniconda\pkgs

Pycharm环境安装与设置

​  IDE集成开发环境(Integrated Development Envircment)的缩写。它是一个软件应用程序,为软件开发提供全面的功能。IDE通常至少包含以下组件:

  • 源代码编辑器:提供语法高亮、自动补全、代码折叠等功能,方便开发者编写和编辑代码。
  • 构建自动化工具:自动化编译、链接、打包等构建过程,简化软件构建流程。
  • 调试器:帮助开发者查找和修复代码中的错误

​  PyCharm出自JetBrains之手。是一种Python IDE,带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮,Project管理、代码跳转、智能提示、自动完成,单元测试、版本控制。此外,该IDE提供了一些高级功能,以用于支持Django框架下的专业Web开发

PyCharm 的优点

  • 方便的环境管理
  • 自动导入包
  • 方便的代码调试
  • Git管理

Pycharm的缺点

  • 刚开始打开,索引包较慢
  • 内存占用太高(3G左右)

Pycharm的下载

https://www.jetbrains.com/pycharm/download

安装:

环境配置

VSCode安装与配置

VSCode(Visual Studio Code)出自微软之手,以界面简洁,轻量著称

​  VSCode是一款免费开源的现代化轻量级代码编辑器,支持几乎所有主流的开发语言的语法高亮、智能代码补全、自定义热键、括号匹配、代码片段、代码对比 Diff、GIT 等特性,支持插件扩展,并针对网页开发和云端应用开发做了优化

​ VSCode编辑器支持多种语言和文件格式的编写,已经支持了如下37种语言或文件:F#、HandleBars、Markdown、Python、Jade、PHP、Haxe、Ruby、Sass、Rust、PowerShell、Groovy、R、Makefile、HTML、JSON、TypeScript、Batch、Visual Basic、Swift、Less、SQL、XML、Lua、Go、C++、Ini、Razor、Clojure、C#、Objective-C、CSS、JavaScript、Perl、CoffeeScript、Java、Dockerfile

VSCode的优点

  • 启动超快,相比于Pycharm
  • 内存占用小(没有漫长等待索引过程)
  • 界面好看,有着丰富的主题配色(pycharm也不差)

VSCode的缺点

  • 插件需要安装太多
  • 默认不支持python的自动导包功能

VSCode的下载

Download Visual Studio Code - Mac, Linux, Windows

VSCode安装

VSCode环境配置

虽然VSCode支持开发多种语言,但默认并没有配置开发Python插件,因此需要安装Python插件

具体环境配置步骤

安装Python组件

  • 点击-左侧插件图表(4个小方块)
  • 输入Python
  • 点击安装即可

选择Python解释器

  • VSCode左下角选择Python版本

若是没有选择Python解释窗口,需要建立一个Python文件即可

相关推荐
2zcode1 小时前
基于YOLO11的轨道交通车站客流密度实时监测与拥挤预警系统(数据集+UI界面+训练代码+数据分析)
目标跟踪·数据挖掘·数据分析·客流量
Captain_Data2 小时前
Python机器学习实战:用Scikit-learn从0构建信用风险评分模型(含WOE编码+AUC/KS/PSI评估+评分卡转换)
python·机器学习·数据分析·scikit-learn·风控建模
极光代码工作室3 小时前
基于大数据的交通流量分析系统
大数据·hadoop·python·数据分析·数据可视化
码界筑梦坊3 小时前
361-基于Python的空气质量气候数据分析预测系统
python·信息可视化·数据分析·flask·vue·毕业设计
YangYang9YangYan3 小时前
产品经理学习数据分析的价值与路径
学习·数据分析·产品经理
babe小鑫4 小时前
2026数学专业人才发展学数据分析的价值
数据挖掘·数据分析
2zcode5 小时前
基于YOLO11的人员异常行为检测与识别智能安防监控系统(数据集+UI界面+训练代码+数据分析)
数据挖掘·数据分析
Cloud_Shy61818 小时前
Python 数据分析基础入门:《Excel Python:飞速搞定数据分析与处理》学习笔记系列(第八章 使用读写包操作 Excel 文件 上篇)
python·数据分析·excel·pandas
小白学大数据19 小时前
基于大模型的Python智能爬虫:语义识别与数据清洗实践
开发语言·爬虫·python·数据分析