前言:什么是生成器,他和迭代器的区别是什么?什么时生成器表达式,为什么和列表推导式那么像呢?
生成器:
定义:能够动态(循环一次,计算一次,返回一次)提供数据的可迭代对象。
作用:在循环过程中,按照某种算法推算数据,不必创建容器存储完整的结果,从而节省内存空间。延迟操作或者惰性操作,在需要的时候计算结果,而不是一次构建所有结果。
生成器原理代码案例:
"""生成器原理"""
class MyGenerator:
def __init__(self):
self.list_generator = []
self.index = -1
def __iter__(self):
return self
def __next__(self):
try:
self.index += 1
return self.list_generator[self.index]
except IndexError:
raise StopIteration
my_generator = MyGenerator()
my_generator.list_generator = [1, 2, 3, 4, 5, 6]
for item in my_generator:
print(item) # 1 2 3 4 5 6
?生成器函数:
定义:含有yield语句的函数,返回值为生成器对象。
调用生成器函数将返回一个生成器对象,不执行函数体,调用迭代器对象的next()方法时才执行生成器函数,?每次执行到yield语句时返回数据,暂时离开,待下次调用next()方法时继续从离开处继续执行。
yield原理大致为:将yield语句之前的代码放入next函数中,之后的数据作为next函数的返回值。
生成器函数的代码案例:
def generator_func():
list_nums = [1, 2, 3, 4, 5, 6]
for item in list_nums:
yield item
def_generator = generator_func()
# 第一次迭代
for item in def_generator:
print(item) # 1 2 3 4 5 6
# 第二次迭代
for item in def_generator:
print(item) #
上面的generator_func函数 与 上面我们写的MyGenerator类型 做的是同一件事,MyGenerator是生成器的原理。通过上面生成器原理我们可以知道,生成器既是一个可迭代对象,又是一个迭代器。但是我们每次迭代生成器的时候,都是使用同一个生成器对象,当我们迭代过一次生成器对象时,生成器对象的 index指针已经指向最后一个,当我们再次遍历生成器对象时,生成器对象的__next__会抛出StopIteration来直接终止迭代。
生成器表达式:
定义:用推导式形式创建生成器对象。
代码案例:
# 生成器表达式
generator_nums = (i for i in range(5))
print(generator_nums.__next__()) # 0
?内置生成器:
枚举函数 enumerate
使用代码案例:
# enumerate 枚举函数 (生成器)
list_nums = [1, 2, 3]
for item in enumerate(list_nums):
print(item) # (0, 1) (1, 2) (2, 3)
for i, item in enumerate(list_nums):
print(i, item) # 0 1, 1 2, 2 3
?zip
使用代码案例:
# zip 压缩 (生成器)
list_keys = ['name', 'age', 'sex']
list_values = ['tan', '22', 'nan']
for item in zip(list_keys, list_values):
print(item) # ('name', 'tan') ('age', '22') ('sex', 'nan')
# 字典转换
dict_person = dict(zip(list_keys, list_values))
print(dict_person)
dict_person = {k: v for k, v in zip(list_keys, list_values)}
print(dict_person)
# 常用于矩阵转置
list_map = [
[1, 2, 3, 4],
[1, 2, 3, 4],
[1, 2, 3, 4],
[1, 2, 3, 4]
]
print([list(item) for item in zip(*list_map)])
# [[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3], [4, 4, 4, 4]]
?让我们来看看几道常考的面试题吧
面试题:
? ? ? ? 1.请简述迭代器和生成器的却别。
? ? ? ? ????????答:迭代器只有__next__函数,只负责生成下一个元素,
? ? ? ? ? ? ? ? ? ? ? ? 可迭代对象每次被for时都会调用__iter__函数创建新迭代器,
? ? ? ? ? ? ? ? ? ? ? ? 生成器既有__next__函数也有__iter__函数,但__iter__函数返回自身对象,
? ? ? ? ? ? ? ? ? ? ? ? 所以生成器对象第二次参与for循环时不再执行。
? ? ? ? 2.请简述生成器表达式和列表推导式的区别。
? ? ? ? ? ? ? ? 答:首先生成器表达式和列表推导式在语法上只有中括号和小括号之分,
? ? ? ? ? ? ? ? ? ? ? ? 列表推导式更擅长于对数据的增删改,但所有数据占用内存空间。
? ? ? ? ? ? ? ? ? ? ? ? 生成器表达式会产生生成器对象,即使产生大量数据也只存储当前,
? ? ? ? ? ? ? ? ? ? ? ? 不存之前数据,不占内存。