数据科学与智能分析基础--开发环境配置

数据科学与智能分析基础

开发环境配置

Anaconda与Miniconda介绍

  Anaconda指的是一个非常强大的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。因为包含了大量的科学包,Anaconda 的下载文件比较大,如果只需要某些包,或者需要节省带宽或存储空间,也可以使用Miniconda这个较小的发行版(仅包含conda和 Python)

  conda是一个开源的包、环境管理器,可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换

下载

Miniconda下载地址

Index of /miniconda

Index of /anaconda/miniconda/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

安装

1:点击next

  确认安装是否完成,通过PowerShell查看

Conda虚拟环境

​  Python 应用经常需要使用一些包第三方包或者模块,有时需要依赖特定的包或者库的版本,所以不能有一个能适应所有 Python 应用的软件环境

  很多时候不同的 Python 应用所依赖的版本是冲突的,满足了其中一个,另一个则无法运行,解决这一问题的方法是虚拟环境

  虚拟环境是一个包含了特定 Python 解析器以及一些软件包,不同的应用程序可以使用不同的虚拟环境,从而解决了依赖冲突问题,而且虚拟环境中只需要安装应用相关的包或者模块,可以给部署提供便利。

建议:

  如果使用anaconda进行多个项目开发,最好创建不同的虚拟环境,也就是为每个项目配置独立的虚拟环境,使得彼此之间不会受到任何干扰。

Anaconda虚拟环境命令

  • 显示已存在虚拟环境
python 复制代码
conda info --envs
  • 创建虚拟环境
python 复制代码
conda create -n 虚拟环境名称 python=版本号
  • 删除虚拟环境
python 复制代码
conda remove -n 虚拟环境名称 --all
  • 激活\进入虚拟环境
python 复制代码
conda activate 虚拟环境名称
  • 退出虚拟环境
python 复制代码
conda deactivate 虚拟环境名称

说明:

  • 创建虚拟环境后,默认会在Anaconda安装目录的envs下,
  • 创建虚拟环境相关文件
  • 创建的虚拟环境仅安装一些必须软件包,例如pip等。如果需要安装Anaconda所有库,需要使用如下命令:
py 复制代码
conda create -n 虚拟环境名称 python=版本号anaconda

显示虚拟环境:

PowerShell无法激活虚拟环境

问题:

  在使用PowerShell激活虚拟环境时,发现激活无效,而在CMD中可以

解决方案

  • 检查是否是执行脚本的权限,或者直接开启权限,使用管理员权限下,执行命令: SetExecutionPolicy RemoteSigned ,输入Y即可
  • 必须将Anaconda 写入环境变量。使用管理员权限下,执行命令: conda init powershell
  • Conda版本小于4.6,编写命令不加conda命令: activate 环境名 , 大于4.6使用 conda activate环境名
  • 修改完后,重启下powershell

PowerShell显示虚拟环境名称

  在终端输入 conda config --set auto_activate_base false ,即可

  如果又反悔了,想显示了,可以使用如下命令:

conda config --set auto_activate_base true

Conda软件模块的管理

  conda是一个软件的管理器,可用来下载、删除Python的软件包(与pip有些类似)

  • 安装:conda install 软件/模块
  • 卸载:conda remove 软件/模块
  • 查看:conda list

pip管理

  • 安装:pip install 软件/模块
  • 卸载:pip uninstall 软件/模块
  • 查看:pip list

conda 对比 pip

  conda在安装包时会同时处理所有依赖关系,包括

  • Python解释器版本
  • C/C++库
  • CUDA等硬件相关的依赖
  • 其他编程语言的依赖

  conda使用严格的依赖解析器,可以预先检查所有依赖冲突

  pip只管理Python包,不管理系统级别的依赖

数据源与路径设置

需要掌握点

  • 设置虚拟环境目录
  • 设置下载软件的数据源
  • 设置缓存目录

配置文件

  Linux用户可以通过修改用户目录下的 .condarc 文件

  Windows 用户无法直接创建名为 .condarc 的文件,可先执行 condaconfig 生成该文件之后再修改

清华大学开源软件镜像站 https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/

python 复制代码
channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

命令

conda数据源

python 复制代码
conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge

conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/

pip数据源

python 复制代码
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

设置虚拟环境目录:

python 复制代码
envs_dirs:
 - D:\miniconda3\envs

设置缓存软件目录:

python 复制代码
pkgs_dirs:
 - D:\miniconda\pkgs

Pycharm环境安装与设置

​  IDE集成开发环境(Integrated Development Envircment)的缩写。它是一个软件应用程序,为软件开发提供全面的功能。IDE通常至少包含以下组件:

  • 源代码编辑器:提供语法高亮、自动补全、代码折叠等功能,方便开发者编写和编辑代码。
  • 构建自动化工具:自动化编译、链接、打包等构建过程,简化软件构建流程。
  • 调试器:帮助开发者查找和修复代码中的错误

​  PyCharm出自JetBrains之手。是一种Python IDE,带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮,Project管理、代码跳转、智能提示、自动完成,单元测试、版本控制。此外,该IDE提供了一些高级功能,以用于支持Django框架下的专业Web开发

PyCharm 的优点

  • 方便的环境管理
  • 自动导入包
  • 方便的代码调试
  • Git管理

Pycharm的缺点

  • 刚开始打开,索引包较慢
  • 内存占用太高(3G左右)

Pycharm的下载

https://www.jetbrains.com/pycharm/download

安装:

环境配置

VSCode安装与配置

  VSCode(Visual Studio Code)出自微软之手,以界面简洁,轻量著称

​  VSCode是一款免费开源的现代化轻量级代码编辑器,支持几乎所有主流的开发语言的语法高亮、智能代码补全、自定义热键、括号匹配、代码片段、代码对比 Diff、GIT 等特性,支持插件扩展,并针对网页开发和云端应用开发做了优化

​ VSCode编辑器支持多种语言和文件格式的编写,已经支持了如下37种语言或文件:F#、HandleBars、Markdown、Python、Jade、PHP、Haxe、Ruby、Sass、Rust、PowerShell、Groovy、R、Makefile、HTML、JSON、TypeScript、Batch、Visual Basic、Swift、Less、SQL、XML、Lua、Go、C++、Ini、Razor、Clojure、C#、Objective-C、CSS、JavaScript、Perl、CoffeeScript、Java、Dockerfile

VSCode的优点

  • 启动超快,相比于Pycharm
  • 内存占用小(没有漫长等待索引过程)
  • 界面好看,有着丰富的主题配色(pycharm也不差)

VSCode的缺点

  • 插件需要安装太多
  • 默认不支持python的自动导包功能

VSCode的下载

Download Visual Studio Code - Mac, Linux, Windows

VSCode安装

VSCode环境配置

  虽然VSCode支持开发多种语言,但默认并没有配置开发Python插件,因此需要安装Python插件

具体环境配置步骤

安装Python组件

  • 点击-左侧插件图表(4个小方块)
  • 输入Python
  • 点击安装即可

选择Python解释器

  • VSCode左下角选择Python版本

  若是没有选择Python解释窗口,需要建立一个Python文件即可

相关推荐
Sharewinfo_BJ1 小时前
当 BI 遇上 AI:到底是谁在帮谁?
大数据·人工智能·ai·数据分析·微软·powerbi
TechWayfarer2 小时前
云服务器地域怎么选:用离线IP数据库识别用户来源并优化部署
服务器·数据库·python·tcp/ip·数据分析
精益数智小屋4 小时前
拆解项目管理计划的核心功能:用项目管理计划解决跨部门协作难题
大数据·人工智能·数据分析·云计算·软件工程
YangYang9YangYan4 小时前
数据计算及应用专业学数据分析的价值分析
数据挖掘·数据分析
deephub4 小时前
相关性与因果性:识别伪相关以提升模型在真实环境的可用性
人工智能·机器学习·数据挖掘·数据分析
Quincy_Freak6 小时前
技术随笔|银河麒麟aarch64内网轻量数据分析工具 SQLiteGo 使用体验
大数据·数据库·数据挖掘·数据分析·sqlite·银河麒麟·aarch64
国际学术会议-杨老师7 小时前
2026年量子算法、密码学与数据分析国际会议(QACDA 2026)
数据分析·密码学·量子计算
半只小闲鱼8 小时前
合并多个excel文件到一个文件中
前端·python·数据分析
Regentsoft丽晶软件8 小时前
2026总部看全局、区域看趋势、门店看自己:服装全渠道BI看板的三层架构
经验分享·数据分析·产品运营·bi
babe小鑫9 小时前
2026工商管理专业学习数据分析的价值分析
学习·数据挖掘·数据分析