【数据分析预备】Numpy入门

Jupyter Notebook

  • 是一个基于网页的交互式计算环境
  • 编写代码、运行代码、查看输出、可视化数据、分享报告文档
  • 按单元格运行代码
  • 可展示的信息格式更丰富(支持Markdown和Latex)
  • 交互式运行环境

安装

  • cmd窗口
python 复制代码
pip install notebook
  • 启动
python 复制代码
jupyter notebook
  • 退出
    Ctrl+C

启动后网页界面如下

New一个Python3文件即可得到ipynb文件

  • 分享
    File-Download as

# Markdown

  • 格式比纯文本更丰富
  • 体积比富文本更轻量

两个库

NumPy: Numerical Python

核心数据结构: ND array n维数组

数据类型统一,执行效率高

  • 安装
    cmd
python 复制代码
pip install numpy

报错

解决:切换到python安装目录

输入python -m install numpy

使用

列表转换为数组

python 复制代码
import numpy as np
arr1 = np.array([[1, 2, 3], [4, 5, 6]]) # 二维数组

# 维度
print(arr1.ndim)
# 元组,各个维度元素的个数
print(arr1.shape)
# 元素总个数
print(arr1.size)
# 数组元素的类型
print(arr1.dtype)

#其他创建数组方法
print(np.zeros(3))
print(np.ones(3))
# 元素为数字序列
np.arange(5, 10, 2)

#连接数组
np.concatenate([np.zeros(2), np.ones(4)])

list1 = np.array([5, 17, 3, 26, 31])
sorted_list1 = sorted(list1) # 不改变list1,等同于np.sort(list1)
print(sorted_list1)
print(list1)
list1.sort() # 什么都不返回,改变原始列表
print(list1)

# 用索引获得元素
list1[0:3]

# 数组间运算=向量运算
import math
#聚合操作
list1.max()
list1.sum()
list1.mean()
#广播机制
list1[list1 > 6]

# 逻辑运算
list1[(list1 > 6)&(list1 < 30)]
相关推荐
饼干哥哥2 天前
开源Skills|搭建亚马逊动态关键词库系统,每天抓SSS级机会词
人工智能·深度学习·数据分析
倔强的石头_3 天前
企业工商数据源站点:无验证无拦截,批量获取工商数据完整方案
数据分析
hboot10 天前
AI工程师第二课 - 数据处理
人工智能·python·数据分析
王小王-12311 天前
基于 Hive 的网易云音乐数据分析及可视化系统
hive·hadoop·数据分析·音乐数据分析·网易云音乐分析·hive音乐分析·hadoop网易云
Database_Cool_11 天前
大规模数据分析降本指南:AnalyticDB Serverless 弹性架构实战
数据仓库·阿里云·架构·数据分析·serverless
YangYang9YangYan11 天前
2026初入职场学习数据分析的价值
学习·数据挖掘·数据分析
有Li11 天前
PTCMIL:基于提示 token 聚类的全切片图像多实例学习分析文献速递/多模态医学影像最新进展
论文阅读·学习·数据挖掘·聚类·文献·医学生
数睿数据无代码开发11 天前
打破数据孤岛:深度解析 smardaten 数据连接器核心功能
数据挖掘·无代码
砚底藏山河11 天前
沪深A股:如何获取基金持股数据
java·python·数据分析·maven
jarreyer11 天前
【数据分析绘图】excel绘图和bi工具区别
数据挖掘·数据分析·excel