文章目录
概念
生成器定义 在Python中,一边循环一边计算的机制,称为生成器:generator
为什么要有生成器
列表所有数据都在内存中,如果有海量数据的话将会非常耗内存。如:仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间
都白白浪费了。如果列表元素按照某种算法推算出来,那我们就可以在循环的过程中不断推算出后续的元素,这样就不必创建完整的list,从而节省大量的空间。
换言之:时间换空间!想要得到庞大的数据,又想让它占用空间少,那就用生成器!延迟计算!需要的时候,再计算出数据
创建方式-生成器表达式
生成器表达式很简单,只要把一个列表推导式的[]
改成()
,就创建了一个生成器(generator):
python
L = [x * x for x in range(10)] #这是列表
print(L)
g = (x * x for x in range(10)) #这是生成器
print(g)
print(list(g))
输出结果:
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
<generator object at 0x000001959C07ED50>
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
创建方式-生成器函数
如果一个函数中包含yield
关键字,那么这个函数就不再是一个普通函数,调用函数就是创建了一个生成器(generator)
对象。
生成器函数:其实就是利用关键字yield
一次性返回一个结果,阻塞,重新开始
生成器函数工作原理
1 生成器函数返回一个迭代器,for
循环对这个迭代器不断调用__next__()
函数,不断运行到下一个yield
语句,一次一次取得每一个返回值,直到没有yield
语句为止,最终引发StopIteration
异常。
2 yield
相当于return
返回一个值,并且记住这个返回的位置,下次迭代时,代码从yield
的下一条语句(不是下一行)开始执行。
3 send() 和next()
,都能让生成器继续往下走一步(下次遇到yield
停),但send()
能传一个值,这个值作为yield
表达式整体的结果
python
def test():
print("start")
i=0
while i<3:
temp = yield i #下次迭代时,代码从`yield`的下一条语句(不是下一行)开始执行
print(f"temp:{temp}")
i += 1
print("end")
return "done"
if __name__ == '__main__':
a = test()
print(type(a))
print(a.__next__())
print(a.__next__())
print(a.__next__()) # next(a) 一样
print(a.__next__()) # 抛出异常:StopIteration
输出结果
start
0
temp:None
1
temp:None
2
temp:None
end
Traceback (most recent call last):
Cell In[78], line 16
print(a.next ()) # 抛出异常:StopIteration
StopIteration: done
python
# send的作用是唤醒并继续执行,发送一个信息到生成器内部
def foo():
print("start")
i = 0
while i<2:
temp = yield i
print(f"temp:{temp}")
i=i+1
print("end")
g = foo()
print(next(g))
print("*"*20)
print(g.send(100))
print(next(g))
因此,生成器仅仅保存了一套生成数值的算法,并且没有让这个算法现在就开始执行,而是我什么时候调它,它什么时候开始计算一个新的值,并给你返回。故而生成器有以下特点:
1 生成器函数生成一系列结果。通过yield
关键字返回一个值后,还能从其退出的地方继续运行,因此可以随时间产生一系列的值。
2 生成器和迭代是密切相关的,迭代器都有一个__next__()
成员方法,这个方法要么返回迭代的下一项,要么引起异常结束迭代。
3 生成器是一个特殊的程序,可以被用作控制循环的迭代行为,python中生成器是迭代器的一种,使用yield
返回值函数,每次调用yield
会暂停,而可以使用next() 函数和send()
函数恢复生成器。
4 生成器看起来像是一个函数,但是表现得却像是迭代器