Python生成器

发布时间:2023年12月22日

一、Python生成器介绍

1.什么是生成器

在Python中,使用了 yield 的函数被称为生成器(generator)。

跟普通函数不同的是,生成器是一个返回迭代器的函数(一次一个值),只能用于迭代操作,更简单点理解生成器就是一个迭代器

2.生成器的作用

内存占用少,节约资源(后面会有具体案例说明)。

二、创建生成器

创建生成器有两种方法,一种是把列表生成式的中括号[]改成小括号(),一种是函数中包含yield关键字。

1.列表生成式与生成器

# 列表生成式
list_1 = [x * x for x in range(10)]
# 生成器
# 把列表生成式的中括号[]改成小括号(),就成了生成器
list_generator = (x * x for x in range(10))

前面说了生成器的最大好处就是节约内存资源,下面打印一下列表list_1和生成器list_generator,对比一下他们的内存占用:

print(list_1.__sizeof__())  # 84字节
print(list_generator.__sizeof__())  # 48字节

一个是84字节,一个是48字节,看起来并不明显,我们把range范围扩大到1000000,也就是包含一百万个元素,此时再来对比:

list_1 = [x * x for x in range(1000000)]
list_generator = (x * x for x in range(1000000))
print(list_1.__sizeof__())  # 4348720字节
print(list_generator.__sizeof__())  # 48字节

当range范围扩大到1000000后,列表list_1占用了4348720字节,而生成器list_generator仍然只占用了48字节(因为一次只取一个值)。因此可以得出结论:使用列表会一次性将元素都加载到内存中,占用大量的内存,如果内存不够的话,很可能还会出现Out Of Memory,而我们只需要访问部分元素,造成了大量的资源浪费;而使用生成器,因为一次只加载一个元素的缘故,所以会比较节约资源

2.函数生成器

坦白讲,如果遇到比较复杂的算法,使用列表推导式写起来会比较麻烦,也不易于阅读,此时可以用函数来实现。例如,读取一个大文本文件:

def read_large_file(file):
    with open(file=file, encoding="utf8") as f:
        lines = f.readlines()
        for line in lines:
            yield line


for i in read_large_file("c:/test_file.txt"):
    print(i)

三、生成器的执行顺序

  • 带有 yield 的函数不再是一个普通函数,而是一个生成器generator。
  • yield相当于 return 返回一个值,并且记住这个返回值的位置,下次迭代时,代码从yield的下一条语句开始执行
  • # 生成器执行顺序
    def yield_order(n):
        for i in range(n):
            print("i: ", i)
            yield i * 2
            print("i = ", i)
        print("done")
    for i in yield_order(5):
        print(i)
    '''
    i: 0
    0
    i = 0
    i: 1
    2
    i = 1
    i: 2
    4
    i = 2
    i: 3
    6
    i = 3
    i: 4
    8
    i = 4
    done
    '''
    执行过程分析:
    *** 第一次迭代 i=0 ***
    i: 0
    0
    第一次迭代i=0,yield相当于return返回一个值0,并且记住这个返回值的位置i * 2,也就是0 * 2,乘积为0,所以在调用函数打印i的时候就是0
    *** 第二次迭代 i=1 ***
    i = 0
    i: 1
    2
    第二次迭代i=1,yield相当于return返回一个值1,并且记住这个返回值的位置i * 2,也就是1 * 2,乘积为2,所以在调用函数打印i的时候就是2
    第二次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 0
    *** 第三次迭代 i=2 ***
    i = 1
    i: 2
    4
    第三次迭代i=2,yield相当于return返回一个值2,并且记住这个返回值的位置i * 2,也就是2 * 2,乘积为4,所以在调用函数打印i的时候就是4
    第三次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 1
    *** 第四次迭代 i=3 ***
    i = 4
    i: 3
    6

    第四次迭代i=3,yield相当于return返回一个值3,并且记住这个返回值的位置i * 2,也就是3 * 2,乘积为6,所以在调用函数打印i的时候就是6

    第四次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 2

  • *** 第五次迭代 i=4 ***
    i = 3
    i: 4
    8
    i = 4
    done

第五次迭代i=4,yield相当于return返回一个值4,并且记住这个返回值的位置i * 2,也就是4 * 2,乘积为8,所以在调用函数打印i的时候就是8

第三次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 3

四、用生成器实现斐波那契数列

斐波那契数列(Fibonacci sequence),又称黄金分割数列,因数学家莱昂纳多·斐波那契(Leonardo Fibonacci)以兔子繁殖为例子而引入,故又称为“兔子数列”,指的是这样一个数列:1、1、2、3、5、8、13、21、34、……在数学上,斐波那契数列以如下被以递推的方法定义:F(0)=0,F(1)=1, F(n)=F(n - 1)+F(n - 2)(n ≥ 2,n ∈ N*)。

# 生成器实现斐波那契数列
def fib(number):
    """number表示最大数量"""
    n, a, b = 0, 0, 1
    while n < number:
        yield b
        a, b = b, a + b
        n = n + 1

for i in fib(5):
    print(i)

小结

  • 使用yield的函数都是生成器函数,可以使用for循环获取值,也可以使用next获取生成器函数的值
  • 生成器仅仅保存了一套生成数值的算法,并且没有让这个算法现在就开始执行,而是什么时候调它,它什么时候开始计算一个新的值,并返回。

?

?

?

?

?

?

?

文章来源:https://blog.csdn.net/bodyzsm/article/details/135162200
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。