Python——生成器
概要
生成器作用:解决"数据占用内存过大"问题的有效办法;
内部原理:生成器内部通过特定算法推导出值,生成器本身只保存推导出值的算法,并不保存值;
创建生成器
一、生成器表达式
回顾以下:之前的列表推导式
list1 = [i for i in range(5)]
生成器表达式类似于列表推导式,使用的符号发生变化:
generator1 = (i for i in range(5))
使用next函数对生成器进行迭代,当无法继续迭代会抛出StopIteration异常:
print(next(generator1))
print(next(generator1))
for i in generator1:
print(i)
二、生成器函数
定义:通过编写"算法",创建生成器对象;
特点:
1、函数中必须包含yield关键字;
2、yield返回什么,就是每次迭代时推导出什么;
3、每一次迭代时,生成器内部的代码都将执行到下一个yield的位置暂停;
代码案例:
1、定义一个简单的生成器
def gen_fun():
num = 0
while num < 10:
yield num
num += 1
if __name__ == '__main__':
gen = gen_fun()
print(next(gen))
2、比较生成器对象和列表对象的空间大小
list1 = [i for i in range(1000)]
gen1 = (i for i in range(1000))
print(sys.getsizeof(list1))
print(sys.getsizeof(gen1))
? 结论:由此可见,定义1000个数大小的列表,占比是生成器的100多倍,所以在内存占比要求小的任务中,使用生成器比列表要更优;
迭代器
注意点:
1、可迭代对象并不一定是迭代器;
2、迭代器内部一定要实现__iter__和__next__,可以作为next函数的参数;
3、迭代器最节约内存;
代码案例(判断列表是不是迭代器):
from collections.abc import Iterable, Iterator
list1 = [1, 2, 3]
print(isinstance(list1, Iterable))
print(isinstance(list1, Iterator))
比较迭代器和生成器的空间占比可以发现,迭代器占比是生成器的二分之一;
关于迭代器的生成,详见__iter__和__next__方法的使用;(介绍Python类的特殊方法部分)
end!希望大家在开发中多使用迭代器和生成器,达到节省内存和高效开发的作用!
|