1、如何对迭代器做切片操作?
????????实际案例:
????????????????有某个文本文件,我们想读取其中某范围的内容,如100~300行之间的内容,python中文本文件是可迭代对象,我们是否可以使用类似列表切片的方式得到一个100~300行文件内容的生成器?
????????????????f=open('/var/log/dmesg', 'rb')
????????????????f[100:300] # 可以么?
????????解决方案:
????????????????使用标准库中的itertools.islice,它能返回一个迭代对象切片的生成器。
????????注:为什么是迭代对象切片的生成器,因为islice会消耗迭代对象中元素有点类似生成器。
2、代码演示
(1)文本迭代简单介绍
# 查看Linux下kernel信息,cat -n /var/log/dmesg
# 文本迭代:
f = open('/var/log/system.log')
# readlines()可以将文件的每一行读到一个列表当中,然后使用切片
lines = f.readlines()
print(lines[200:201])
'''
但是也存在一个问题readlines()方法会一次性的把整个文件
全部导入到内存当中,如果文件很小没问题,但是日志文件一般都很大
一次性导入可能导致内存不足。
'''
# 因为使用readlines文件指针已经到了文件尾部
# 使用seek()方法使文件指针返回文件头部
f.seek(0)
# 读取文件最好方式还是使用迭代
for line in f:
print(line)
(2)实现迭代对象切片操作
from itertools import islice
'''
可以使用help(islice)查看silica使用介绍:
islice(iterable, stop) --> islice object
islice(iterable, start, stop[, step]) --> islice object
示例:
情况1:查看200行到210行内容,slice(f, 200, 210)
情况2:只查看前200行,islice(f, 200),只有一个参数表示结尾值
情况3:只查看200行到末尾,islice(f, 200, None)
注意:islice不支持负引索,因为在没读完整个文件是不知道文件是多少行的。
'''
f = open('/var/log/system.log')
# 返回一个生成器对象,通过生成器对象,可以设置范围start到end行
islice(f, 200, 210)
# 查看200行到210行内容
for line in islice(f, 200, 210):
print(line)
'''
需要注意的是silice()方法会消耗迭代器对象,每次使用islice要重新申请对象
'''
l = range(20)
print(list(l))
t = iter(l)
# t是经过迭代的,直到遇到起始值5,5之前的都被消耗了
for x in islice(t, 5, 10):
print(x, end=" ")
print()
# 再次迭代t,发现输出是从10开始一直到最后,所以每次使用islice要重新申请对象
for x in t:
print(x, end=" ")
|