B站课链接:【Python数据分析三剑客:NumPy、Pandas与Matplotlib】 https://www.bilibili.com/video/BV1Yb4y1g7SV/?p=16\&share_source=copy_web\&vd_source=e883bdf439c7a2e47e9145990387a56b
014,开始使用numpy
(1),numpy介绍
(2),导入numpy库,并查看numpy版本
#数据分析三剑客
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
np.__version__
(3)实例:读取猫图片的数据
#我自己电脑上的图片(猫咪1.jpg),注意路径是 / ,只有一个/
#图片:其实是数字组成的,三维数组
# RGB 红Red,绿Green,蓝Blue
# RGB 范围:0~255
# plt.imread : 读取图片的数据
cat = plt.imread('C:/Users/romantic/Pictures/Saved Pictures/猫咪1.jpg')
cat
type(cat)
# numpy.ndarray : 多维数组
# nd : n维度,多维
# array : 数组
#查看形状:三维
# (540, 960, 3)
# 高度:540行
# 宽度:960列
# 3 表示的RGB(red,green,blue)的值
cat.shape
#显示图片
plt.imshow(cat)
# (540, 960, 3)
# 图片:3维数据(彩色)
# 2维数据(黑白)
# 视频:4维数据
# (x,540, 960, 3),x表示多少张图片
#一切皆数据,一切皆矩阵(在数据中)
015,创建ndarray数组
ndarray是numpy中表示数组的重要类型
(1),使用np.array() 创建
参数为列表:[1,4,2,5,3]
I = [1,4,2,3,5,6]
n = np.array(I)
n
type(n) #类型
# numpy.ndarray
n.shape #形状,6表示一维数组里有6个元素
# I.shape # 列表没有shape
# 优先级:str>float>int
n = np.array([3.14,2,"hello"])
n
(2),使用np的routines函数创建
(2.1)ones
n = np.ones(shape=(3,4)) #3行4列
n
n = np.ones(shape=(3,4,5),dtype=np.int16) # 3个二维数组,每个二维数组是4行5列,类型为整型
# n = np.ones(shape=(3,4,5),dtype=int)
n
(2.2)zeros
n = np.zeros((5,5),dtype=np.int16) # 5行5列,类型为整型
n
(2.3)full
n = np.full(shape=(3,4),fill_value=2) # 3行4列,所有元素都为2
n
(2.4)eye
#对角线为1,其他位置为0的二维数组
#单位矩阵:主对角线都是1,其他都是0
n = np.eye(6,6,dtype=np.int8) # 6行6列,类型为整型
n
# k=2:向右偏移2个位置
n = np.eye(6,6,k=2,dtype=np.int8)
n
# k=-2:向左偏移2个位置
n = np.eye(6,6,k=-2,dtype=np.int8)
n
(2.5)linspace
#等差数列
# 1,3,5,7,9
n = np.linspace(0,100,num=51,dtype=np.int16) #0~2占了一份,其他2~100中间有50份
n
# endpoint=False
n = np.linspace(0,100,num=51,endpoint=False)# 不包含100
n
#retstep=True : 显示步长
n = np.linspace(0,100,num=51,retstep=True)
n
(2.6)arange
n = np.arange(10) # 0~9,不包含10
n
n = np.arange(2,10) # 2~9,不包含10
n
n = np.arange(2,10,2) # 2~9,不包含10,步长为2
n
(2.7)random.randint
# 随机整数,范围:[0,3]
n = np.random.randint(3)
n
# 随机整数,范围:[3,10]
n = np.random.randint(3,10)
n
# 随机整数:一维,一维数组里有6个元素
n = np.random.randint(3,10,size=6)
n
# 随机整数:二维,3行4列
n = np.random.randint(3,10,size=(3,4))
n
# 随机整数:三维,也可以理解为:3个二维数组,每个二维数组是4行5列
n = np.random.randint(3,10,size=(3,4,5))
n
(2.8)random.random
n = np.random.random(size=(3,4))
n
017,ndarray常用属性
cat.shape # 三维数组
# (540, 960, 3)
# 第一个维度:540
# 第二个维度:960
# 第三个维度:3
# 有几个数字就表示几维
cat.ndim # 维度
cat.size # 总数据量 540*960*3
cat.dtype # 元素类型
# uint8:无符号整数
018,索引操作(以下代码直接截图了)
根据索引修改数据
019,切片操作
一维与列表完全一致,多维同理
020,翻转操作
021,数组变形reshape
使用reshape函数
022,数组的级联合并
(22.1)np.concatenate()
- 参数是列表或元组
- 级联的数组维度必须相同
- 可通过axis参数改变级联的方向
(22.2)np.hstack 与 np.vstack
- 水平级联与垂直级联
023,数组的拆分/切分/分割
025,聚合函数
(25.1)np.sum 和 np.nansum (nan:not a number)
- nan:数值类型,not a number:不是一个正常的数值,表示空
- np.nan:float类型
029,数组的快速排序
030,文件IO操作
(30.1)保存数组
- save:保存ndarray到一个npy文件
- savez:将多个array保存到一个npz文件中
生成的文件
(30.2)读取数组
(30.3)csv,txt文件的读写操作
031,练习题讲解1
(31.1)创建一个长度为10的一维全为0的ndarray对象,然后让第5个元素等于1
(31.2)创建一个元素为从10到49的ndarray对象
(31.3)将第2题的所有元素位置反转
(31.4)使用np.random.random创建一个10*10的ndarray对象,并打印出最大最小元素
(31.5)创建一个10*10的ndarray对象,且矩阵边界全为1,里面全为0
第1种方法
第2种方法