在Python中,使用了 yield 的函数被称为生成器(generator)。
跟普通函数不同的是,生成器是一个返回迭代器的函数(一次一个值),只能用于迭代操作,更简单点理解生成器就是一个迭代器。
内存占用少,节约资源(后面会有具体案例说明)。
创建生成器有两种方法,一种是把列表生成式的中括号[]改成小括号(),一种是函数中包含yield关键字。
# 列表生成式
list_1 = [x * x for x in range(10)]
# 生成器
# 把列表生成式的中括号[]改成小括号(),就成了生成器
list_generator = (x * x for x in range(10))
前面说了生成器的最大好处就是节约内存资源,下面打印一下列表list_1和生成器list_generator,对比一下他们的内存占用:
print(list_1.__sizeof__()) # 84字节
print(list_generator.__sizeof__()) # 48字节
一个是84字节,一个是48字节,看起来并不明显,我们把range范围扩大到1000000,也就是包含一百万个元素,此时再来对比:
list_1 = [x * x for x in range(1000000)]
list_generator = (x * x for x in range(1000000))
print(list_1.__sizeof__()) # 4348720字节
print(list_generator.__sizeof__()) # 48字节
当range范围扩大到1000000后,列表list_1占用了4348720字节,而生成器list_generator仍然只占用了48字节(因为一次只取一个值)。因此可以得出结论:使用列表会一次性将元素都加载到内存中,占用大量的内存,如果内存不够的话,很可能还会出现Out Of Memory,而我们只需要访问部分元素,造成了大量的资源浪费;而使用生成器,因为一次只加载一个元素的缘故,所以会比较节约资源
坦白讲,如果遇到比较复杂的算法,使用列表推导式写起来会比较麻烦,也不易于阅读,此时可以用函数来实现。例如,读取一个大文本文件:
def read_large_file(file):
with open(file=file, encoding="utf8") as f:
lines = f.readlines()
for line in lines:
yield line
for i in read_large_file("c:/test_file.txt"):
print(i)
# 生成器执行顺序
def yield_order(n):
for i in range(n):
print("i: ", i)
yield i * 2
print("i = ", i)
print("done")
for i in yield_order(5):
print(i)
'''
i: 0
0
i = 0
i: 1
2
i = 1
i: 2
4
i = 2
i: 3
6
i = 3
i: 4
8
i = 4
done
'''
执行过程分析:
*** 第一次迭代 i=0 ***
i: 0
0
第一次迭代i=0,yield相当于return返回一个值0,并且记住这个返回值的位置i * 2,也就是0 * 2,乘积为0,所以在调用函数打印i的时候就是0
*** 第二次迭代 i=1 ***
i = 0
i: 1
2
第二次迭代i=1,yield相当于return返回一个值1,并且记住这个返回值的位置i * 2,也就是1 * 2,乘积为2,所以在调用函数打印i的时候就是2
第二次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 0
*** 第三次迭代 i=2 ***
i = 1
i: 2
4
第三次迭代i=2,yield相当于return返回一个值2,并且记住这个返回值的位置i * 2,也就是2 * 2,乘积为4,所以在调用函数打印i的时候就是4
第三次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 1
*** 第四次迭代 i=3 ***
i = 4
i: 3
6
第四次迭代i=3,yield相当于return返回一个值3,并且记住这个返回值的位置i * 2,也就是3 * 2,乘积为6,所以在调用函数打印i的时候就是6
第四次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 2
*** 第五次迭代 i=4 ***
i = 3
i: 4
8
i = 4
done
第五次迭代i=4,yield相当于return返回一个值4,并且记住这个返回值的位置i * 2,也就是4 * 2,乘积为8,所以在调用函数打印i的时候就是8
第三次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 3
斐波那契数列(Fibonacci sequence),又称黄金分割数列,因数学家莱昂纳多·斐波那契(Leonardo Fibonacci)以兔子繁殖为例子而引入,故又称为“兔子数列”,指的是这样一个数列:1、1、2、3、5、8、13、21、34、……在数学上,斐波那契数列以如下被以递推的方法定义:F(0)=0,F(1)=1, F(n)=F(n - 1)+F(n - 2)(n ≥ 2,n ∈ N*)。
# 生成器实现斐波那契数列
def fib(number):
"""number表示最大数量"""
n, a, b = 0, 0, 1
while n < number:
yield b
a, b = b, a + b
n = n + 1
for i in fib(5):
print(i)
?
?
?
?
?
?
?