【深耕 Python】Data Science with Python 数据科学(2)jupyter-lab和numpy数组

关于数据科学环境的建立,可以参考我的博客:【深耕 Python】Data Science with Python 数据科学(1)环境搭建

Jupyter代码片段1:简单数组的定义和排序

python 复制代码
import numpy as np
np.array([1, 2, 3])
a = np.array([9, 6, 2, 4, 3, 1])
print(len(a))
a.sort()
print(a)
a

输出结果:

Jupyter代码片段2:范围数组

python 复制代码
r = range(17)
print(r)
print(list(r))
a = np.arange(17)
a

输出结果:

Jupyter代码片段3:对数组的整体操作

python 复制代码
print([3 * i for i in r])
print(3 * a)
a ** 2

输出结果:

Jupyter代码片段4:numpy vs 循环用时比较

python 复制代码
import timeit
t1 = timeit.timeit("[i ** 2 for i in range(50)]")
t2 = timeit.timeit("import numpy as np; np.arange(50) ** 2")
t1, t2, t1 / t2

输出结果:

优化的底层原理: NumPy将循环语句使用C语言进行优化(Python本即用C语言写成)。

进一步比较2者的速度差异

python 复制代码
%%timeit
[i ** 2 for i in range(1000)]
python 复制代码
%%timeit
np.arange(1000) ** 2

输出#1:96 µs ± 5.32 µs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)

输出#2:4.04 µs ± 413 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)

这样,二者运算速度的区别就一目了然了。

Jupyter代码片段5:高维数组及其子数组

python 复制代码
a = np.array([[1, 2, 3], [4, 5, 6]])
print(a)
print(a.shape)
print(a[0, :])
print(a[:, 0])
A = a[0:2, 0:2]
print(A)
A = a[:2, :2]
A

输出结果:

Jupyter代码片段6:二维数组(矩阵)的求逆

python 复制代码
Ainv = np.linalg.inv(A)
print(Ainv)
print(A + Ainv)
print(A * Ainv)
print(A @ Ainv)
print(np.matmul(A, Ainv))

输出结果:

注意: (2阶)单位阵处的浮点误差。

Jupyter代码片段7:数组(矩阵)的重构

python 复制代码
a = np.arange(16)
print(a.reshape((2, 8)))
print(a)
b = a.reshape((4, 4))
print(b)
a.reshape((-1, 2))

输出结果:

注意(小坑点): 使用a.reshape()并不会改变a本身,需要结合赋值语句来使用。

参考文献 Reference

Learn Enough PYTHON to be Dangerous: Software Development, Flask Web Apps, and Beginning Data Science with Python, Michael Hartl, Pearson, 2023.

相关推荐
2301_812539671 小时前
Golang怎么实现网页爬虫抓取数据_Golang如何用colly框架快速构建爬虫采集程序【教程】
jvm·数据库·python
xcbrand1 小时前
政府事业机构品牌策划公司哪家可靠
大数据·人工智能·python
爱滑雪的码农2 小时前
Java基础十一 流(Stream)、文件(File)和IO
java·开发语言·python
knight_9___2 小时前
LLM工具调用面试篇5
人工智能·python·深度学习·面试·职场和发展·llm·agent
小学生-山海3 小时前
YOLO火焰/烟雾检测系统
python·yolo
浔川python社3 小时前
浔川社团第一次福利数据公布
人工智能·python·deepseek
一晌小贪欢3 小时前
第1节:数据分析环境配置——Jupyter Notebook全攻略
jupyter·数据挖掘·数据分析·可视化·数据可视化
方也_arkling3 小时前
【大模型】初步认识RAG
人工智能·python
迁旭3 小时前
prompt_toolkit 3.0.52 API 参考手册
python
WL_Aurora4 小时前
Python 算法基础篇之堆和优先队列
python·算法