机械学习—零基础学习日志(Python做数据分析04)

列表

与元组对比,列表的长度可变、内容可以被修改。你可以用方括号定义,或用list函数:

操作列表:

增添:append方法,insert方法,list.extend(list)

删除:del方法,pop方法,remove方法

判断元素是否在列表内:in方法

排序:sorted(list),list.sort()。

二分搜索和维护已排序的列表

bisect模块支持二分查找,和向已排序的列表插入值。bisect.bisect可以找到插入值后仍保证排序的位置,bisect.insort是向这个位置插入值:

重点解释一下:

python 复制代码
import bisect

a = [1, 3, 4, 4, 7, 8]
x = 4

# 查找插入点
index = bisect.bisect(a, x)
print(index)  # 输出 4

在这个例子中,列表 a[1, 3, 4, 4, 7, 8],我们查找 4 的插入点。由于 bisect 默认是右查找,因此返回索引 4,表示如果插入 4,它会位于列表中已经存在的最后一个 4 之后。所以,是把你需要的数值后一位插入位置(index),帮助你找出来。

注意:bisect模块不会检查列表是否已排好序,进行检查的话会耗费大量计算。因此,对未排序的列表使用bisect不会产生错误,但结果不一定正确。

enumerate函数

Python内建了一个enumerate函数,可以返回(i, value)元组序列:

python 复制代码
for i, value in enumerate(collection):
   # do something with value

当你索引数据时,使用enumerate的一个好方法是计算序列(唯一的)dict映射到位置的值:

python 复制代码
In [83]: some_list = ['foo', 'bar', 'baz']

In [84]: mapping = {}

In [85]: for i, v in enumerate(some_list):
   ....:     mapping[v] = i

In [86]: mapping
Out[86]: {'bar': 1, 'baz': 2, 'foo': 0}

zip函数

zip可以将多个列表、元组或其它序列成对组合成一个元组列表:

python 复制代码
In [89]: seq1 = ['foo', 'bar', 'baz']

In [90]: seq2 = ['one', 'two', 'three']

In [91]: zipped = zip(seq1, seq2)

In [92]: list(zipped)
Out[92]: [('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

zip可以处理任意多的序列,元素的个数取决于最短的序列:

python 复制代码
In [93]: seq3 = [False, True]

In [94]: list(zip(seq1, seq2, seq3))
Out[94]: [('foo', 'one', False), ('bar', 'two', True)]

给出一个"被压缩的"序列,zip可以被用来解压序列。也可以当作把行的列表转换为列的列表。这个方法看起来有点神奇:

python 复制代码
In [96]: pitchers = [('Nolan', 'Ryan'), ('Roger', 'Clemens'),
   ....:             ('Schilling', 'Curt')]

In [97]: first_names, last_names = zip(*pitchers)

In [98]: first_names
Out[98]: ('Nolan', 'Roger', 'Schilling')

In [99]: last_names
Out[99]: ('Ryan', 'Clemens', 'Curt')

重点参考来源:

相关推荐
SunsPlanter4 分钟前
PotPlayer 安装 madVR、LAV Filters 以提升解码能力和视频音频效果
学习
赱向远方17 分钟前
【软件推荐——pdf2docx】
python·pdf·开源软件·docx·软件推荐·doc·pdf2docx
helloworld工程师22 分钟前
Java实现PDF加水印功能:技术解析与实践指南
java·开发语言·pdf
五花肉村长40 分钟前
Linux-进程信号
linux·运维·服务器·开发语言·网络·c++
镜舟科技1 小时前
时序数据库、实时数据库与实时数仓:如何为实时数据场景选择最佳解决方案?
数据库·物联网·数据分析·时序数据库·olap·实时数仓·实时数据库
再看扣你眼1 小时前
系统安全及应用学习笔记
笔记·学习·系统安全
半青年1 小时前
Qt读取Excel文件的技术实现与最佳实践
c语言·c++·python·qt·c#·excel
AA-代码批发V哥1 小时前
Java-List集合类全面解析
java·开发语言·list
无闻墨客1 小时前
数据分析与应用---数据可视化基础
python·信息可视化·数据挖掘·数据分析·matplotlib
羚羊角uou1 小时前
【C++】map和multimap的常用接口详解
开发语言·c++