原文: https://www.programiz.com/python-programming/iterator

迭代器是可以迭代的对象。 在本教程中,您将学习迭代器如何工作以及如何使用__iter____next__方法构建自己的迭代器。

Python 中的迭代器

迭代器在 Python 中无处不在。 它们在for循环,理解力,生成器等中优雅地实现,但隐藏在清晰的视野中。

Python 中的迭代器只是可以对其进行迭代的对象。 一个将返回数据的对象,一次返回一个元素。

从技术上讲,Python 迭代器对象必须实现两个特殊方法__iter__()__next__(),统称为迭代器协议

如果我们可以从中获得一个迭代器,则该对象称为可迭代对象。 Python 中大多数内置容器都是可迭代的,例如:列表元组字符串等。

iter()函数(依次调用__iter__()方法)从它们返回一个迭代器。


通过迭代器进行迭代

我们使用next()函数手动迭代迭代器的所有项目。 当我们到达末尾并且没有更多数据要返回时,它将引发StopIteration异常。 以下是一个示例。

  1. # define a list
  2. my_list = [4, 7, 0, 3]
  3. # get an iterator using iter()
  4. my_iter = iter(my_list)
  5. # iterate through it using next()
  6. # Output: 4
  7. print(next(my_iter))
  8. # Output: 7
  9. print(next(my_iter))
  10. # next(obj) is same as obj.__next__()
  11. # Output: 0
  12. print(my_iter.__next__())
  13. # Output: 3
  14. print(my_iter.__next__())
  15. # This will raise error, no items left
  16. next(my_iter)

输出

  1. 4
  2. 7
  3. 0
  4. 3
  5. Traceback (most recent call last):
  6. File "<string>", line 24, in <module>
  7. next(my_iter)
  8. StopIteration

一种更优雅的自动迭代方式是for循环。 使用此方法,我们可以迭代可以返回迭代器的任何对象,例如列表,字符串,文件等。

  1. >>> for element in my_list:
  2. ... print(element)
  3. ...
  4. 4
  5. 7
  6. 0
  7. 3

迭代器和for循环

如上例所示,for循环能够自动迭代列表。

实际上,for循环可以迭代任何可迭代的对象。 让我们仔细看看for循环是如何在 Python 中实际实现的。

  1. for element in iterable:
  2. # do something with element

实际上是实现为。

  1. # create an iterator object from that iterable
  2. iter_obj = iter(iterable)
  3. # infinite loop
  4. while True:
  5. try:
  6. # get the next item
  7. element = next(iter_obj)
  8. # do something with element
  9. except StopIteration:
  10. # if StopIteration is raised, break from loop
  11. break

因此,在内部,for循环通过在可迭代对象上调用iter()创建了迭代器对象iter_obj

具有讽刺意味的是,这个for循环实际上是一个无限while循环

在循环内部,它调用next()获取下一个元素,并使用该值执行for循环的主体。 所有物品耗尽后,StopIteration抛出,内部被卡住,循环结束。 请注意,任何其他类型的异常都将通过。


构建自定义迭代器

在 Python 中从头开始构建迭代器很容易。 我们只需要实现__iter__()__next__()方法。

__iter__()方法返回迭代器对象本身。 如果需要,可以执行一些初始化。

__next__()方法必须返回序列中的下一项。 在到达末尾以及随后的调用中,它必须提高StopIteration

在这里,我们显示一个示例,该示例将在每次迭代中为我们提供下一个 2 的幂。 幂指数从零开始一直到用户设置的数字。

  1. class PowTwo:
  2. """Class to implement an iterator
  3. of powers of two"""
  4. def __init__(self, max=0):
  5. self.max = max
  6. def __iter__(self):
  7. self.n = 0
  8. return self
  9. def __next__(self):
  10. if self.n <= self.max:
  11. result = 2 ** self.n
  12. self.n += 1
  13. return result
  14. else:
  15. raise StopIteration
  16. # create an object
  17. numbers = PowTwo(3)
  18. # create an iterable from the object
  19. i = iter(numbers)
  20. # Using next to get to the next iterator element
  21. print(next(i))
  22. print(next(i))
  23. print(next(i))
  24. print(next(i))
  25. print(next(i))

输出

  1. 1
  2. 2
  3. 4
  4. 8
  5. Traceback (most recent call last):
  6. File "/home/bsoyuj/Desktop/Untitled-1.py", line 32, in <module>
  7. print(next(i))
  8. File "<string>", line 18, in __next__
  9. raise StopIteration
  10. StopIteration

我们还可以使用for循环来迭代迭代器类。

  1. >>> for i in PowTwo(5):
  2. ... print(i)
  3. ...
  4. 1
  5. 2
  6. 4
  7. 8
  8. 16
  9. 32

Python 无限迭代器

不必耗尽迭代器对象中的项目。 可以有无限迭代器(永无止境)。 处理此类迭代器时必须小心。

这是一个演示无限迭代器的简单示例。

可以使用两个参数来调用内置函数 iter()函数,其中第一个参数必须是可调用的对象(函数),第二个参数是前哨。 迭代器将调用此函数,直到返回的值等于哨兵。

  1. >>> int()
  2. 0
  3. >>> inf = iter(int,1)
  4. >>> next(inf)
  5. 0
  6. >>> next(inf)
  7. 0

我们可以看到int()函数始终返回 0。因此,将其传递为iter(int,1)将返回一个迭代器,该迭代器将调用int(),直到返回的值等于 1。这永远不会发生,并且会得到一个无限的迭代器。

我们还可以构建自己的无限迭代器。 理论上,以下迭代器将返回所有奇数。

  1. class InfIter:
  2. """Infinite iterator to return all
  3. odd numbers"""
  4. def __iter__(self):
  5. self.num = 1
  6. return self
  7. def __next__(self):
  8. num = self.num
  9. self.num += 2
  10. return num

样本运行如下。

  1. >>> a = iter(InfIter())
  2. >>> next(a)
  3. 1
  4. >>> next(a)
  5. 3
  6. >>> next(a)
  7. 5
  8. >>> next(a)
  9. 7

等等…

在这些类型的无限迭代器上进行迭代时,请小心包含终止条件。

使用迭代器的优点是节省了资源。 如上图所示,我们无需将整个数字系统存储在内存中就可以获得所有奇数。 从理论上讲,我们可以在有限内存中包含无限项。

有一种在 Python 中创建迭代器的简便方法。 要了解更多信息,请访问:使用yield的 Python 生成器