Python生成器

发布时间：2023年12月22日

一、Python生成器介绍

1.什么是生成器

在Python中，使用了 yield 的函数被称为生成器（generator）。

跟普通函数不同的是，生成器是一个返回迭代器的函数(一次一个值)，只能用于迭代操作，更简单点理解生成器就是一个迭代器。

2.生成器的作用

内存占用少，节约资源（后面会有具体案例说明）。

二、创建生成器

创建生成器有两种方法，一种是把列表生成式的中括号[]改成小括号()，一种是函数中包含yield关键字。

1.列表生成式与生成器

# 列表生成式
list_1 = [x * x for x in range(10)]
# 生成器
# 把列表生成式的中括号[]改成小括号()，就成了生成器
list_generator = (x * x for x in range(10))

前面说了生成器的最大好处就是节约内存资源，下面打印一下列表list_1和生成器list_generator，对比一下他们的内存占用：

print(list_1.__sizeof__())  # 84字节
print(list_generator.__sizeof__())  # 48字节

一个是84字节，一个是48字节，看起来并不明显，我们把range范围扩大到1000000，也就是包含一百万个元素，此时再来对比：

list_1 = [x * x for x in range(1000000)]
list_generator = (x * x for x in range(1000000))
print(list_1.__sizeof__())  # 4348720字节
print(list_generator.__sizeof__())  # 48字节

当range范围扩大到1000000后，列表list_1占用了4348720字节，而生成器list_generator仍然只占用了48字节（因为一次只取一个值）。因此可以得出结论：使用列表会一次性将元素都加载到内存中，占用大量的内存，如果内存不够的话，很可能还会出现Out Of Memory，而我们只需要访问部分元素，造成了大量的资源浪费；而使用生成器，因为一次只加载一个元素的缘故，所以会比较节约资源

2.函数生成器

坦白讲，如果遇到比较复杂的算法，使用列表推导式写起来会比较麻烦，也不易于阅读，此时可以用函数来实现。例如，读取一个大文本文件：

def read_large_file(file):
    with open(file=file, encoding="utf8") as f:
        lines = f.readlines()
        for line in lines:
            yield line


for i in read_large_file("c:/test_file.txt"):
    print(i)

三、生成器的执行顺序

带有 yield 的函数不再是一个普通函数，而是一个生成器generator。
yield相当于 return 返回一个值，并且记住这个返回值的位置，下次迭代时，代码从yield的下一条语句开始执行。

# 生成器执行顺序
def yield_order(n):
    for i in range(n):
        print("i: ", i)
        yield i * 2
        print("i = ", i)
    print("done")
for i in yield_order(5):
    print(i)
'''
i: 0
0
i = 0
i: 1
2
i = 1
i: 2
4
i = 2
i: 3
6
i = 3
i: 4
8
i = 4
done
'''
执行过程分析：
*** 第一次迭代 i=0 ***
i: 0
0
第一次迭代i=0，yield相当于return返回一个值0，并且记住这个返回值的位置i * 2，也就是0 * 2，乘积为0，所以在调用函数打印i的时候就是0
*** 第二次迭代 i=1 ***
i = 0
i: 1
2
第二次迭代i=1，yield相当于return返回一个值1，并且记住这个返回值的位置i * 2，也就是1 * 2，乘积为2，所以在调用函数打印i的时候就是2
第二次迭代会从yield的下一条语句开始执行也就是print("i = ", i)，打印结果为：i = 0
*** 第三次迭代 i=2 ***
i = 1
i: 2
4
第三次迭代i=2，yield相当于return返回一个值2，并且记住这个返回值的位置i * 2，也就是2 * 2，乘积为4，所以在调用函数打印i的时候就是4
第三次迭代会从yield的下一条语句开始执行也就是print("i = ", i)，打印结果为：i = 1
*** 第四次迭代 i=3 ***
i = 4
i: 3
6

第四次迭代i=3，yield相当于return返回一个值3，并且记住这个返回值的位置i * 2，也就是3 * 2，乘积为6，所以在调用函数打印i的时候就是6

第四次迭代会从yield的下一条语句开始执行也就是print("i = ", i)，打印结果为：i = 2

*** 第五次迭代 i=4 ***
i = 3
i: 4
8
i = 4
done

第五次迭代i=4，yield相当于return返回一个值4，并且记住这个返回值的位置i * 2，也就是4 * 2，乘积为8，所以在调用函数打印i的时候就是8

第三次迭代会从yield的下一条语句开始执行也就是print("i = ", i)，打印结果为：i = 3

四、用生成器实现斐波那契数列

斐波那契数列（Fibonacci sequence），又称黄金分割数列，因数学家莱昂纳多·斐波那契（Leonardo Fibonacci）以兔子繁殖为例子而引入，故又称为“兔子数列”，指的是这样一个数列：1、1、2、3、5、8、13、21、34、……在数学上，斐波那契数列以如下被以递推的方法定义：F(0)=0，F(1)=1, F(n)=F(n - 1)+F(n - 2)（n ≥ 2，n ∈ N*）。

# 生成器实现斐波那契数列
def fib(number):
    """number表示最大数量"""
    n, a, b = 0, 0, 1
    while n < number:
        yield b
        a, b = b, a + b
        n = n + 1

for i in fib(5):
    print(i)

小结

使用yield的函数都是生成器函数，可以使用for循环获取值，也可以使用next获取生成器函数的值
生成器仅仅保存了一套生成数值的算法，并且没有让这个算法现在就开始执行，而是什么时候调它，它什么时候开始计算一个新的值，并返回。

文章来源:https://blog.csdn.net/bodyzsm/article/details/135162200
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！