机械学习—零基础学习日志(Python做数据分析04)

列表

与元组对比,列表的长度可变、内容可以被修改。你可以用方括号定义,或用list函数:

操作列表:

增添:append方法,insert方法,list.extend(list)

删除:del方法,pop方法,remove方法

判断元素是否在列表内:in方法

排序:sorted(list),list.sort()。

二分搜索和维护已排序的列表

bisect模块支持二分查找,和向已排序的列表插入值。bisect.bisect可以找到插入值后仍保证排序的位置,bisect.insort是向这个位置插入值:

重点解释一下:

python 复制代码
import bisect

a = [1, 3, 4, 4, 7, 8]
x = 4

# 查找插入点
index = bisect.bisect(a, x)
print(index)  # 输出 4

在这个例子中,列表 a[1, 3, 4, 4, 7, 8],我们查找 4 的插入点。由于 bisect 默认是右查找,因此返回索引 4,表示如果插入 4,它会位于列表中已经存在的最后一个 4 之后。所以,是把你需要的数值后一位插入位置(index),帮助你找出来。

注意:bisect模块不会检查列表是否已排好序,进行检查的话会耗费大量计算。因此,对未排序的列表使用bisect不会产生错误,但结果不一定正确。

enumerate函数

Python内建了一个enumerate函数,可以返回(i, value)元组序列:

python 复制代码
for i, value in enumerate(collection):
   # do something with value

当你索引数据时,使用enumerate的一个好方法是计算序列(唯一的)dict映射到位置的值:

python 复制代码
In [83]: some_list = ['foo', 'bar', 'baz']

In [84]: mapping = {}

In [85]: for i, v in enumerate(some_list):
   ....:     mapping[v] = i

In [86]: mapping
Out[86]: {'bar': 1, 'baz': 2, 'foo': 0}

zip函数

zip可以将多个列表、元组或其它序列成对组合成一个元组列表:

python 复制代码
In [89]: seq1 = ['foo', 'bar', 'baz']

In [90]: seq2 = ['one', 'two', 'three']

In [91]: zipped = zip(seq1, seq2)

In [92]: list(zipped)
Out[92]: [('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

zip可以处理任意多的序列,元素的个数取决于最短的序列:

python 复制代码
In [93]: seq3 = [False, True]

In [94]: list(zip(seq1, seq2, seq3))
Out[94]: [('foo', 'one', False), ('bar', 'two', True)]

给出一个"被压缩的"序列,zip可以被用来解压序列。也可以当作把行的列表转换为列的列表。这个方法看起来有点神奇:

python 复制代码
In [96]: pitchers = [('Nolan', 'Ryan'), ('Roger', 'Clemens'),
   ....:             ('Schilling', 'Curt')]

In [97]: first_names, last_names = zip(*pitchers)

In [98]: first_names
Out[98]: ('Nolan', 'Roger', 'Schilling')

In [99]: last_names
Out[99]: ('Ryan', 'Clemens', 'Curt')

重点参考来源:

相关推荐
wt_cs15 分钟前
银行回单ocr api集成解析-图像文字识别-文字识别技术
开发语言·python
you458035 分钟前
小程序学习笔记:使用 MobX 实现全局数据共享,实例创建、计算属性与 Actions 方法
笔记·学习·小程序
_WndProc37 分钟前
【Python】Flask网页
开发语言·python·flask
互联网搬砖老肖39 分钟前
Python 中如何使用 Conda 管理版本和创建 Django 项目
python·django·conda
叶子爱分享1 小时前
浅谈「线性代数的本质」 - 系列合集
线性代数
luofeiju1 小时前
RGB下的色彩变换:用线性代数解构色彩世界
图像处理·人工智能·opencv·线性代数
测试者家园1 小时前
基于DeepSeek和crewAI构建测试用例脚本生成器
人工智能·python·测试用例·智能体·智能化测试·crewai
liujing102329291 小时前
Day04_刷题niuke20250703
java·开发语言·算法
大模型真好玩1 小时前
准确率飙升!Graph RAG如何利用知识图谱提升RAG答案质量(四)——微软GraphRAG代码实战
人工智能·python·mcp
Brookty1 小时前
【MySQL】JDBC编程
java·数据库·后端·学习·mysql·jdbc