Python 数据分析环境搭建与工具使用指南

概述

开发流程

  1. 明确分析的目的和思路
  2. 数据采集
  3. 数据的预处理
  4. 数据的分析
  5. 数据的可视化

Python数据分析常用开源库

Pandas,Numpy,Matplotlib,Seaborn,Sklearn,Jupyter Notebook/JupyterLab

Anaconda

Conda 命令介绍

查看沙箱,虚拟环境

bash 复制代码
查看虚拟环境列表
conda info --envs
conda env list

创建虚拟环境

bash 复制代码
创建一个虚拟python环境:
conda create -n DL_Pytorch python=3.8.5

退出当前虚拟环境

bash 复制代码
conda deactivate

进入虚拟环境

bash 复制代码
conda activate DL_Pytorch

安装插件,需要进入环境

bash 复制代码
# Pytorch的安装
pip install torch==1.10.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

# 默认不进入base
conda config --set auto_activate_base false

查看属性信息

  • conda env list
  • conda info -e
  • conda info --envs
bash 复制代码
C:\Users\31094>conda env list

# conda environments:
#
base                   E:\ttools\anaconda3

创建一个环境,做 pyTorch,版本是3.9

bash 复制代码
conda create -n DL_Pytorch python=3.9

conda 会询问你是否接受 Anaconda 的 使用条款(Terms of Service, ToS),这是在下载和安装包时的一个法律声明。

选 A,同意

  • 按 a 并回车:接受使用条款,继续安装。

  • 按 r 并回车:拒绝使用条款,安装将会停止。

  • 按 v 并回车:查看条款的详细内容。

安装完成。

bash 复制代码
conda activate 虚拟环境名
# 安装 torch
pip install torch==1.10.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

删除虚拟环境

bash 复制代码
conda remove -n 环境名 --all

PyCharm 如何选择现有的Conda环境

Jupyter Notebook 使用

进入虚拟环境输入命令启动,如果localhost访问,无需密码,如果地址访问是需要密码的。

bash 复制代码
jupyter notebook

常用快捷键

命令模式,按ESC进入

  • Y,cell切换到Code模式
  • M,cell切换到Markdown模式
  • A,在当前cell的上面添加cell
  • B,在当前cell的下面添加cell
  • 双击D:删除当前cell

编辑模式,按Enter进入

  • 多光标操作:Ctrl键点击鼠标(Mac:CMD+点击鼠标)回退:Ctrl+Z(Mac:CMD+Z)
  • 重做:Ctrl+Y(Mac:CMD+Y)
  • 补全代码:变量、方法后跟Tab键
  • 为一行或多行代码添加/取消注释:Ctrl+/(Mac:CMD+/)

常用

  • Shift+Enter,执行本单元代码,并跳转到下一单元
  • Ctrl+Enter,执行本单元代码,留在本单元
  • cell行号前的 * ,表示代码正在运行

中文扩展库

安装 jupyter_contrib_nbextensions 库,我的版本太高,不兼容这个库,暂不考虑调整。

bash 复制代码
pip install jupyter_contrib_nbextensions

markdown 模式

一级标题 ## 二级标题 ### 三级标题

最高五级。

  • 内容

Pycharmn 连接 Jupyter Notebook

记得切换

相关推荐
AI攻城狮1 小时前
用 Playwright 实现博客一键发布到稀土掘金
python·自动化运维
曲幽1 小时前
FastAPI分布式系统实战:拆解分布式系统中常见问题及解决方案
redis·python·fastapi·web·httpx·lock·asyncio
孟健16 小时前
Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析
python
码路飞18 小时前
写了个 AI 聊天页面,被 5 种流式格式折腾了一整天 😭
javascript·python
曲幽20 小时前
FastAPI压力测试实战:Locust模拟真实用户并发及优化建议
python·fastapi·web·locust·asyncio·test·uvicorn·workers
敏编程1 天前
一天一个Python库:jsonschema - JSON 数据验证利器
python
前端付豪1 天前
LangChain记忆:通过Memory记住上次的对话细节
人工智能·python·langchain
databook1 天前
ManimCE v0.20.1 发布:LaTeX 渲染修复与动画稳定性提升
python·动效
花酒锄作田2 天前
使用 pkgutil 实现动态插件系统
python