机械学习—零基础学习日志(Python做数据分析04)

列表

与元组对比,列表的长度可变、内容可以被修改。你可以用方括号定义,或用list函数:

操作列表:

增添:append方法,insert方法,list.extend(list)

删除:del方法,pop方法,remove方法

判断元素是否在列表内:in方法

排序:sorted(list),list.sort()。

二分搜索和维护已排序的列表

bisect模块支持二分查找,和向已排序的列表插入值。bisect.bisect可以找到插入值后仍保证排序的位置,bisect.insort是向这个位置插入值:

重点解释一下:

python 复制代码
import bisect

a = [1, 3, 4, 4, 7, 8]
x = 4

# 查找插入点
index = bisect.bisect(a, x)
print(index)  # 输出 4

在这个例子中,列表 a[1, 3, 4, 4, 7, 8],我们查找 4 的插入点。由于 bisect 默认是右查找,因此返回索引 4,表示如果插入 4,它会位于列表中已经存在的最后一个 4 之后。所以,是把你需要的数值后一位插入位置(index),帮助你找出来。

注意:bisect模块不会检查列表是否已排好序,进行检查的话会耗费大量计算。因此,对未排序的列表使用bisect不会产生错误,但结果不一定正确。

enumerate函数

Python内建了一个enumerate函数,可以返回(i, value)元组序列:

python 复制代码
for i, value in enumerate(collection):
   # do something with value

当你索引数据时,使用enumerate的一个好方法是计算序列(唯一的)dict映射到位置的值:

python 复制代码
In [83]: some_list = ['foo', 'bar', 'baz']

In [84]: mapping = {}

In [85]: for i, v in enumerate(some_list):
   ....:     mapping[v] = i

In [86]: mapping
Out[86]: {'bar': 1, 'baz': 2, 'foo': 0}

zip函数

zip可以将多个列表、元组或其它序列成对组合成一个元组列表:

python 复制代码
In [89]: seq1 = ['foo', 'bar', 'baz']

In [90]: seq2 = ['one', 'two', 'three']

In [91]: zipped = zip(seq1, seq2)

In [92]: list(zipped)
Out[92]: [('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

zip可以处理任意多的序列,元素的个数取决于最短的序列:

python 复制代码
In [93]: seq3 = [False, True]

In [94]: list(zip(seq1, seq2, seq3))
Out[94]: [('foo', 'one', False), ('bar', 'two', True)]

给出一个"被压缩的"序列,zip可以被用来解压序列。也可以当作把行的列表转换为列的列表。这个方法看起来有点神奇:

python 复制代码
In [96]: pitchers = [('Nolan', 'Ryan'), ('Roger', 'Clemens'),
   ....:             ('Schilling', 'Curt')]

In [97]: first_names, last_names = zip(*pitchers)

In [98]: first_names
Out[98]: ('Nolan', 'Roger', 'Schilling')

In [99]: last_names
Out[99]: ('Ryan', 'Clemens', 'Curt')

重点参考来源:

相关推荐
派森先生37 分钟前
sk08.【scikit-learn基础】--『监督学习』之K近邻算法
学习·scikit-learn·近邻算法
流星白龙38 分钟前
【Qt】1.安装QT
开发语言·qt
励志不掉头发的内向程序员41 分钟前
【Linux系列】解码 Linux 内存地图:从虚拟到物理的寻宝之旅
linux·运维·服务器·开发语言·学习
superxxd3 小时前
跨平台音频IO处理库libsoundio实践
开发语言·qt·音视频
qq_436962184 小时前
奥威BI金蝶数据分析可视化方案:200+开箱即用报表驱动智能决策
信息可视化·数据挖掘·数据分析
_OP_CHEN4 小时前
C++基础:(十二)list类的基础使用
开发语言·数据结构·c++·stl·list类·list核心接口·list底层原理
Bellafu6665 小时前
selenium常用的等待有哪些?
python·selenium·测试工具
墨染天姬5 小时前
【AI】数学基础之矩阵
人工智能·线性代数·矩阵
小白学大数据6 小时前
Python爬虫常见陷阱:Ajax动态生成内容的URL去重与数据拼接
爬虫·python·ajax
谷歌开发者6 小时前
Web 开发指向标 | Chrome 开发者工具学习资源 (一)
前端·chrome·学习