可迭代对象(Iterable)
for循环可以作用于的数据类型有:list、tuple、dict、str 和 generator(包括生成器和带 yield 的 generator function) 等,这些可以使用for循环遍历的对象统称为可迭代对象(Iterable)
可以使用isinstance()判断一个对象是否是Iterable对象(可迭代对象)
迭代器(iterator)
python中几乎所有的容器都有__iter__ 内置函数,而这些函数都会返回一个迭代器
我们对迭代器有两点要求。或者说迭代器应该具备迭代器协议。
1.该对象需提供next方法,返回迭代器的下一项
2.如果没有下一项即迭代完成时会抛出一个StopIteration异常。
1、StopIteration
如果有足够的next()语句,或者如果在for循环中使用了该语句,则以上示例将永远继续下去。
为了防止迭代永远进行,我们可以使用StopIteration语句。
在__next__()方法中,如果迭代执行了指定的次数,我们可以添加终止条件以引发错误:
例如:
在20次循环后停止:
class MyNumbers:
def __iter__(self):
self.a = 1
return self
def __next__(self):
if self.a <= 20:
x = self.a
self.a += 1
return x
else:
raise StopIteration
myclass = MyNumbers()
myiter = iter(myclass)
for x in myiter:
print(x)
# 首先获得Iterator对象:
it = iter([1, 2, 3, 4, 5])
# 循环:
while True:
try:
# 获得下一个值:
x = next(it)
except StopIteration:
# 遇到StopIteration就退出循环
break
for循环不会报StopIteration 是因为内部已经做了异常处理
Python的for循环本质上就是通过不断调用next()函数实现
我们发现迭代器最核心的功能就是可以通过next()函数的调用来返回下一个数据值。如果每次返回的数据值不是在一个已有的数据集合中读取的,而是通过程序按照一定的规律计算生成的,那么也就意味着可以不用再依赖一个已有的数据集合,也就是说不用再将所有要迭代的数据都一次性缓存下来供后续依次读取,这样可以节省大量的存储(内存)空间。
生成器(generator)
- 生成器本身是一种特殊的迭代器。
- 生成器会自动实现迭代器协议,也就是说只要我们yield后,自动就生成了next对象包括StopIteration等结构。
- 生成器使用yield语句返回一个值。yield语句挂起该生成器函数的状态,保留足够的信息。对生成器函数的第二次(或第n次)调用,跳转到函数上一次挂起的位置。生成器不仅“记住”了它的数据状态,生成还记住了程序执行的位置。
生成器的使用实例:
[i**2 for i in old_list] # 列表推导式
(i**2 for i in old_list) # 生成器表达式
def get_even_numbers(the_list):
result_list = []
for i in range(len(the_list)):
if the_list[i] % 2 == 0:
result_list.append(i)
return result_list
def get_even_numbers_by_gen(the_list):
for i in range(len(the_list)):
if the_list[i] % 2 == 0:
yield i
# yield from 方法
def test_yield_from(*iterables):
for i in iterables:
for j in i:
yield j
list(test_yield_from([1,2,3], 'abc')) # [1, 2, 3, 'a', 'b', 'c']
# 上述函数等同于下
def test_yield_from(*iterables):
for i in iterables:
yield from i
生成器和迭代器的区别
-
迭代器是访问容器的一种方式,也就是说容器已经出现。我们是从已有元素拓印出一份副本,只为我们此次迭代使用。而生成器则是,而生成器则是自己生成元素的 - 在用法上生成器只需要简单函数写法,配合yield就能实现。而迭代器真正开发中很难使用到。我们可以把生成器看做,python给我们提供的特殊接口实现的迭代器。
?
|