声明
最近在完成一个小作业,比较两个文件的不同之处,并指出不同之处的行数和总次数,脑海中第一个想用的就是for循环遍历,发现总是不得当,过程中就夹杂着遇到读取文件的问题,现在把我当时想法总结一下:
一、read()函数
使用方法:
>>> f = open('text.txt',encoding='utf-8')
>>> f.read()
'你好世界\nhello world\ngoodjob'
明显,read()函数是直接将文件读取成一个字符串,包括换行符"\n",当然如果你是print出来,那就会直接换行的,这个方法的好处就是,对字符串的替换、切割都可以用在这里;不好就是如果文件太大,那这个方法将会耗费你大量内存,实测会崩溃… 以及
文件f可以直接被用for循环直接调用
>>> f = open('text.txt',encoding='utf-8')
>>> for i in f:
print(i)
你好世界
hello world
goodjob
二、readline()
重点要说的是这个方法 这个函数竟然有类似带有yield的迭代器功能,调用一次读一次,调用一次,再从上次结尾处开始再读取一行,看代码效果: readline()函数原本就是读一行,或许是我悟性太低了,竟然不知道readline()可以这样调用…当然最后我理解过来了,应该是和指针有关,你可以理解为打开记事本后出现的光标,你读取一行后,那你的光标自然就已经在这一行的后面了,所以是接着读取文件。 这样可能更容易理解:
text.txt 文件内容如下:
'''
你好,世界
hello world
goodjob
'''
>>> f = open('text.txt',encoding='utf-8')
>>> for i in range(3):
>>> print(f.readline())
'你好,世界'
'hello world'
'goodjob'
>>>
好吧,真的活到老学到shi… 哦哦,readline(size)是可以加参数的,size – 从文件中读取的字节数。返回从字符串中读取的字节。 添加参数的效果也跟迭代器相似,
text.txt 文件内容如下:
'''
你好,世界
hello world
goodjob
'''
>>> f = open('text.txt',encoding='utf-8')
>>> f.readline(3)
'你好世'
>>> f.readline(3)
'界\n'
>>> f.readline(3)
'hel'
>>> f.readline(3)
'lo '
>>> f.readline(3)
'wor'
>>> f.readline(3)
'ld'
>>>
不管是中文还是英文都是计算3个字节。
三、readlines()
这个读取函数比较有意思,生成数据是一个列表,
text.txt 文件内容如下:
'''
你好,世界
hello world
goodjob
'''
>>> f = open('text.txt',encoding='utf-8')
>>> f.readlines()
['你好世界\n', 'hello world\n','goodjob']
>>>
它就是将每一行作为列表的元素之一,按顺序形成列表,当然每一行的换行符也加进去了。
就这样子。
|