NumPy 数组排序、过滤与随机数生成详解

NumPy 数组排序

排序数组

排序数组意味着将元素按特定顺序排列。顺序可以是数字大小、字母顺序、升序或降序等。

NumPy 的 ndarray 对象提供了一个名为 sort() 的函数,用于对数组进行排序。

示例:

python 复制代码
import numpy as np

arr = np.array([3, 2, 0, 1])

print(np.sort(arr))

输出:

python 复制代码
[0 1 2 3]

注意:

sort() 方法会返回数组的副本,原始数组不会被修改。

可以对字符串数组、布尔数组等其他数据类型进行排序。

排序二维数组

对于二维数组,sort() 方法会对每一行进行排序。

示例:

python 复制代码
import numpy as np

arr = np.array([[3, 2, 4], [5, 0, 1]])

print(np.sort(arr))

输出:

python 复制代码
[[0 1 2]
 [3 4 5]]

练习

使用 NumPy 正确的方法对以下数组进行排序:

python 复制代码
arr = np.array([3, 2, 0, 1])

x = np.sort(
    # 请在此处填写代码
)

print(x)

解答:

python 复制代码
x = np.sort(arr)

NumPy 数组过滤

过滤数组

过滤数组是指从现有数组中选取部分元素,并创建新的数组。

在 NumPy 中,可以使用布尔索引列表来过滤数组。布尔索引列表是一个与数组索引相对应的布尔值列表。

如果索引处的值为 True,则该元素会被包含在过滤后的数组中;如果为 False,则会被排除。

示例:

python 复制代码
import numpy as np

arr = np.array([41, 42, 43, 44])

x = [True, False, True, False]

newarr = arr[x]

print(newarr)

输出:

python 复制代码
[41 43]

解释:

新数组 newarr 只包含 arr 中索引为 0 和 2 的元素,因为 x 对应索引处的值为 True

创建过滤数组

通常情况下,我们需要根据条件来创建过滤数组。

示例:

仅返回大于 42 的元素:

python 复制代码
import numpy as np

arr = np.array([41, 42, 43, 44])

filter_arr = arr > 42

newarr = arr[filter_arr]

print(filter_arr)
print(newarr)

输出:

python 复制代码
[False  True  True  True]
[43 44]

仅返回偶数元素:

python 复制代码
import numpy as np

arr = np.array([1, 2, 3, 4, 5, 6, 7])

filter_arr = arr % 2 == 0

newarr = arr[filter_arr]

print(filter_arr)
print(newarr)

输出:

python 复制代码
[False  True  False  True  False  True  False]
[2 4 6]

直接从数组创建过滤

NumPy 提供了一种更简洁的方式来创建过滤数组,即直接在条件中使用数组:

示例:

仅返回大于 42 的元素:

python 复制代码
import numpy as np

arr = np.array([41, 42, 43, 44])

newarr = arr[arr > 42]

print(newarr)

输出:

python 复制代码
[43 44]

仅返回偶数元素:

python 复制代码
import numpy as np

arr = np.array([1, 2, 3, 4, 5, 6, 7])

newarr = arr[arr % 2 == 0]

print(newarr)

输出:

python 复制代码
[2 4 6]

练习

使用 NumPy 的直接过滤方法,从以下数组中过滤出所有平方为偶数的元素:

python 复制代码
import numpy as np

arr = np.

NumPy 中的随机数

什么是随机数?

随机数是指无法通过确定性方法预测其值的数据。通常情况下,随机数是指在一定范围内均匀分布的数字。

在计算机中,由于程序的确定性,不可能生成真正的随机数。因此,通常使用伪随机数来代替随机数。伪随机数是通过算法生成的,但看起来像随机数。

NumPy 中的随机数生成

NumPy 提供了 random 模块用于生成随机数。该模块提供了多种方法,可以生成不同类型和分布的随机数。

生成随机整数

randint(low, high, size):生成指定范围内的随机整数。
low:下限,默认为 0。
high:上限,不包括上限本身。
size:输出数组的形状。

示例:

python 复制代码
import numpy as np

# 生成 10 个介于 0 和 100 之间的随机整数
x = np.random.randint(0, 101, size=10)
print(x)

生成随机浮点数

rand(size):生成介于 0 和 1 之间的随机浮点数。
size:输出数组的形状。

示例:

python 复制代码
import numpy as np

# 生成 5 个随机浮点数
x = np.random.rand(5)
print(x)

从数组中生成随机数

choice(a, size, replace):从数组 a 中随机选择元素。
a:源数组。
size:输出数组的形状。
replace:是否允许重复选择元素,默认为 False

示例:

python 复制代码
import numpy as np

# 从数组 [1, 2, 3, 4, 5] 中随机选择 3 个元素
x = np.random.choice([1, 2, 3, 4, 5], size=3)
print(x)

生成指定分布的随机数

NumPy 还提供了其他方法来生成特定分布的随机数,例如正态分布、均匀分布、指数分布等。

randn(size):生成服从标准正态分布的随机数。
randm(size):生成服从均匀分布的随机整数。
beta(a, b, size):生成服从 Beta 分布的随机数。
gamma(shape, scale, size):生成服从 Gamma 分布的随机数。
poisson(lam, size):生成服从泊松分布的随机整数。

例如,生成 10 个服从标准正态分布的随机数:

python 复制代码
import numpy as np

x = np.random.randn(10)
print(x)

练习

  1. 使用 randint 方法生成一个包含 20 个介于 100 到 200 之间的随机整数的数组。
  2. 使用 rand 方法生成一个包含 15 个介于 0 和 1 之间的随机浮点数的数组。
  3. 从数组 [1, 3, 5, 7, 9] 中随机选择 10 个元素,并允许重复。
  4. 生成 5 个服从标准正态分布的随机数。

解决方案

python 复制代码
import numpy as np

# 1. 使用 randint 方法生成随机整数数组
random_ints = np.random.randint(100, 201, size=20)
print(random_ints)

# 2. 使用 rand 方法生成随机浮点数数组
random_floats = np.random.rand(15)
print(random_floats)

# 3. 从数组中随机选择元素
random_elements = np.random.choice([1, 3, 5, 7, 9], size=10, replace=True)
print(random_elements)

# 4. 生成服从标准正态分布的随机数
normal_randoms = np.random.randn(5)
print(normal_randoms)

最后

为了方便其他设备和平台的小伙伴观看往期文章:

微信公众号搜索:Let us Coding,关注后即可获取最新文章推送

看完如果觉得有帮助,欢迎点赞、收藏、关注

相关推荐
AAA修煤气灶刘哥14 小时前
ES 聚合爽到飞起!从分桶到 Java 实操,再也不用翻烂文档
后端·elasticsearch·面试
小高00714 小时前
🚨 2025 最该淘汰的 10 个前端 API!
前端·javascript·面试
大厂码农老A14 小时前
面试官:“聊聊你最复杂的项目?” 为什么90%的候选人第一句就栽了?
java·面试
禁默14 小时前
Linux 之从硬件硬盘到文件系统的全面过渡
linux·运维·服务器
黑客飓风14 小时前
从基础功能到自主决策, Agent 开发进阶路怎么走?
面试·log4j·bug
塵觴葉14 小时前
Linux内核网络的连接跟踪conntrack简单分析
linux·网络·conntrack
m0_4646082615 小时前
监控 Linux 服务器资源
linux
在未来等你15 小时前
Kafka面试精讲 Day 7:消息序列化与压缩策略
大数据·分布式·面试·kafka·消息队列
一乐小哥15 小时前
一口气同步10年豆瓣记录———豆瓣书影音同步 Notion分享 🚀
后端·python
在未来等你15 小时前
Kafka面试精讲 Day 10:事务机制与幂等性保证
大数据·分布式·面试·kafka·消息队列