【深耕 Python】Data Science with Python 数据科学(2)jupyter-lab和numpy数组

关于数据科学环境的建立,可以参考我的博客:【深耕 Python】Data Science with Python 数据科学(1)环境搭建

Jupyter代码片段1:简单数组的定义和排序

python 复制代码
import numpy as np
np.array([1, 2, 3])
a = np.array([9, 6, 2, 4, 3, 1])
print(len(a))
a.sort()
print(a)
a

输出结果:

Jupyter代码片段2:范围数组

python 复制代码
r = range(17)
print(r)
print(list(r))
a = np.arange(17)
a

输出结果:

Jupyter代码片段3:对数组的整体操作

python 复制代码
print([3 * i for i in r])
print(3 * a)
a ** 2

输出结果:

Jupyter代码片段4:numpy vs 循环用时比较

python 复制代码
import timeit
t1 = timeit.timeit("[i ** 2 for i in range(50)]")
t2 = timeit.timeit("import numpy as np; np.arange(50) ** 2")
t1, t2, t1 / t2

输出结果:

优化的底层原理: NumPy将循环语句使用C语言进行优化(Python本即用C语言写成)。

进一步比较2者的速度差异

python 复制代码
%%timeit
[i ** 2 for i in range(1000)]
python 复制代码
%%timeit
np.arange(1000) ** 2

输出#1:96 µs ± 5.32 µs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)

输出#2:4.04 µs ± 413 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)

这样,二者运算速度的区别就一目了然了。

Jupyter代码片段5:高维数组及其子数组

python 复制代码
a = np.array([[1, 2, 3], [4, 5, 6]])
print(a)
print(a.shape)
print(a[0, :])
print(a[:, 0])
A = a[0:2, 0:2]
print(A)
A = a[:2, :2]
A

输出结果:

Jupyter代码片段6:二维数组(矩阵)的求逆

python 复制代码
Ainv = np.linalg.inv(A)
print(Ainv)
print(A + Ainv)
print(A * Ainv)
print(A @ Ainv)
print(np.matmul(A, Ainv))

输出结果:

注意: (2阶)单位阵处的浮点误差。

Jupyter代码片段7:数组(矩阵)的重构

python 复制代码
a = np.arange(16)
print(a.reshape((2, 8)))
print(a)
b = a.reshape((4, 4))
print(b)
a.reshape((-1, 2))

输出结果:

注意(小坑点): 使用a.reshape()并不会改变a本身,需要结合赋值语句来使用。

参考文献 Reference

Learn Enough PYTHON to be Dangerous: Software Development, Flask Web Apps, and Beginning Data Science with Python, Michael Hartl, Pearson, 2023.

相关推荐
weixin_470740365 小时前
某算法的python执行汇编
汇编·python·算法
mit6.8247 小时前
[RestGPT] docs | RestBench评估 | 配置与环境
人工智能·python
Ice__Cai8 小时前
Flask 之 Cookie & Session 详解:用户状态管理
后端·python·flask·cookie·session
WSSWWWSSW10 小时前
Seaborn数据可视化实战:Seaborn时间序列可视化入门
python·信息可视化·数据分析·matplotlib·seaborn
云天徽上10 小时前
【数据可视化-96】使用 Pyecharts 绘制主题河流图(ThemeRiver):步骤与数据组织形式
开发语言·python·信息可视化·数据分析·pyecharts
codeyanwu10 小时前
nanoGPT 部署
python·深度学习·机器学习
quaer11 小时前
print(2 ** 3)
开发语言·python
翔云12345612 小时前
Python 中 SQLAlchemy 和 MySQLdb 的关系
数据库·python·mysql
三婶儿12 小时前
在没有客户端的客户环境下,如何用 Python 一键执行 MySQL 与达梦数据库 SQL
运维·后端·python
Freak嵌入式13 小时前
一文速通 Python 并行计算:教程总结
开发语言·python