Python 数据分析环境搭建与工具使用指南

概述

开发流程

  1. 明确分析的目的和思路
  2. 数据采集
  3. 数据的预处理
  4. 数据的分析
  5. 数据的可视化

Python数据分析常用开源库

Pandas,Numpy,Matplotlib,Seaborn,Sklearn,Jupyter Notebook/JupyterLab

Anaconda

Conda 命令介绍

查看沙箱,虚拟环境

bash 复制代码
查看虚拟环境列表
conda info --envs
conda env list

创建虚拟环境

bash 复制代码
创建一个虚拟python环境:
conda create -n DL_Pytorch python=3.8.5

退出当前虚拟环境

bash 复制代码
conda deactivate

进入虚拟环境

bash 复制代码
conda activate DL_Pytorch

安装插件,需要进入环境

bash 复制代码
# Pytorch的安装
pip install torch==1.10.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

# 默认不进入base
conda config --set auto_activate_base false

查看属性信息

  • conda env list
  • conda info -e
  • conda info --envs
bash 复制代码
C:\Users\31094>conda env list

# conda environments:
#
base                   E:\ttools\anaconda3

创建一个环境,做 pyTorch,版本是3.9

bash 复制代码
conda create -n DL_Pytorch python=3.9

conda 会询问你是否接受 Anaconda 的 使用条款(Terms of Service, ToS),这是在下载和安装包时的一个法律声明。

选 A,同意

  • 按 a 并回车:接受使用条款,继续安装。

  • 按 r 并回车:拒绝使用条款,安装将会停止。

  • 按 v 并回车:查看条款的详细内容。

安装完成。

bash 复制代码
conda activate 虚拟环境名
# 安装 torch
pip install torch==1.10.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

删除虚拟环境

bash 复制代码
conda remove -n 环境名 --all

PyCharm 如何选择现有的Conda环境

Jupyter Notebook 使用

进入虚拟环境输入命令启动,如果localhost访问,无需密码,如果地址访问是需要密码的。

bash 复制代码
jupyter notebook

常用快捷键

命令模式,按ESC进入

  • Y,cell切换到Code模式
  • M,cell切换到Markdown模式
  • A,在当前cell的上面添加cell
  • B,在当前cell的下面添加cell
  • 双击D:删除当前cell

编辑模式,按Enter进入

  • 多光标操作:Ctrl键点击鼠标(Mac:CMD+点击鼠标)回退:Ctrl+Z(Mac:CMD+Z)
  • 重做:Ctrl+Y(Mac:CMD+Y)
  • 补全代码:变量、方法后跟Tab键
  • 为一行或多行代码添加/取消注释:Ctrl+/(Mac:CMD+/)

常用

  • Shift+Enter,执行本单元代码,并跳转到下一单元
  • Ctrl+Enter,执行本单元代码,留在本单元
  • cell行号前的 * ,表示代码正在运行

中文扩展库

安装 jupyter_contrib_nbextensions 库,我的版本太高,不兼容这个库,暂不考虑调整。

bash 复制代码
pip install jupyter_contrib_nbextensions

markdown 模式

一级标题 ## 二级标题 ### 三级标题

最高五级。

  • 内容

Pycharmn 连接 Jupyter Notebook

记得切换

相关推荐
X56612 小时前
如何在 Laravel 中正确保存嵌套动态表单数据(主服务与子服务)
jvm·数据库·python
ZhengEnCi3 小时前
03ab-PyTorch安装教程 📚
python
狐狐生风3 小时前
LangChain 向量存储:Chroma、FAISS
人工智能·python·学习·langchain·faiss·agentai
狐狐生风3 小时前
LangChain RAG 基础
人工智能·python·学习·langchain·rag·agentai
老前端的功夫4 小时前
【Java从入门到入土】28:Stream API:告别for循环的新时代
java·开发语言·python
yaoxin5211234 小时前
397. Java 文件操作基础 - 创建常规文件与临时文件
java·开发语言·python
dFObBIMmai4 小时前
MySQL主从同步中大事务导致的延迟_如何拆分大事务优化同步
jvm·数据库·python
szccyw05 小时前
mysql如何限制特定存储过程执行权限_MySQL存储过程安全访问
jvm·数据库·python
小白学大数据5 小时前
Python 自动化爬取网易云音乐歌手歌词实战教程
爬虫·python·okhttp·自动化
风之所往_6 小时前
Python 3.0 新特性全面总结
python