文件
1. 什么是文件?
我们平时所创建的变量都是保存在内存中的,我们知道如果重启应用或者重启机器,内存中的数据就会丢失。 如果想让数据能够持久化存储,就可以把数据保存到文件或者是数据库中。
比如windows上,通过后缀名可以看到常见的文件类型有:
- 可执行文件(exe)
- 文本文件(txt)
- 图片文件(jpg、png)
- office文件 (.ppt、.xlsx)
2. 文件路径
一个机器上,会存在很多文件,为了让这些文件更方便的管理和组织,往往会使用很多的“文件夹”,也就是我们平常所说的目录
为了更家准确的确定一个文件的位置,就可以使用文件路径
D:\root\PyCharm Community Edition 2022.1\bin\pycharm64.exe 这就是PyCharm软件的绝对路径
- D:表示的是盘符,不区分大小写
- 每一个
\ 表示一级目录 - 在 windows中目录之间的分割符,可以用
/ 也可以用\ - 这里是是介绍来了绝对路径,和它对应的是相对路径,用
../ 来表示上一级路径,./ 表示当前路径
3. 文件操作
要想使用文件,主要是通过文件来保存数据,在需要的时候把保存的数据读取出来 但是想要读写文件,需要先打开文件,读写完毕之后一定要记得关闭文件,防止文件资源泄露
1) 打开文件
使用内置函数open 打开文件
file = open('D:/root/test.txt', 'r')
print(type(file))
<class '_io.TextIOWrapper'>
- 第一个参数是字符串,表示要打开文件路径
- 第二个参数也是一个字符串,表示文件打开的方式,其中
r 表示只读,w 表示按照写方式打开,a 表示追加的方式打开 - 如果文件打开成功,就会返回一个文件对象,后续的读写文件操作都是围绕着这个文件对象操作
- 如果打开文件败(比如路径写错了或者文件压根不存在),就会抛出异常
2) 关闭文件
是用文件对象.close方法关闭已经打开的文件
file = open('D:/root/test.txt', 'r')
file.close()
使用完一个文件一定要记得及时关闭 一个程序同时打开的文件个数是存在上限的!
my_list = []
count = 0
while True:
file = open('D:/root/test.txt', 'r')
my_list.append(file)
count += 1
print(f'file{count}')
如果一直循环打开文件不关闭的话,达到一定数量就会抛出异常
注意:上面的每个文件对象都用列表保存起来了,如果不保存就不会抛出异常,因为Python内置的垃圾回收机制,会在文件对象销毁的时候自动关闭所有文件 但是垃圾回收机制不一定及时,所以写代码不要依赖垃圾回收机制
3) 写文件
- 如果要写文件,就要以写的方式打开,把第二个参数设置为
w - 使用
write 方法写数据
file = open('D:/root/test.txt', 'w')
file.write('hello world')
file.close()
用记事本打开test.txt文件就能查看被写进去的数据
- 如果使用
r 方式打开文件,则写入时就会抛出异常 - 使用
w 一旦打开文件 成功,就会清空文件原有的数据 - 使用
a 实现“追加写入”,此时原有内容不变,写入的额内容会存在于之前文件内容的末尾
file = open('D:/root/test.txt', 'w')
file.write('hello world')
file.close()
file = open('D:/root/test.txt', 'a')
file.write('\n你好世界')
file.close()
4) 读文件
- 读文件需要使用
r 的方式打开文件 - 使用
read 方法完成操作,参数表示读取几个字符,不填参数则是默认读取整个文件
file = open('D:/root/test.txt', 'r')
tmp = file.read(5)
print(tmp)
- 如果读取文件的时候遇到编码方式报错,可以手动指定的读取文件的编码方式
file = open('D:/root/test.txt', 'r', encoding='utf8')
tmp = file.read()
print(tmp)
file = open('D:/root/test.txt', 'r', encoding='utf8')
count = 1
for tmp in file:
print(f'第{count}行:{tmp}', end='')
count += 1
file.close()
- 使用
readlines 直接把整个文件内容读取出来,返回一个列表,每个元素为一行
file = open('D:/root/test.txt', 'r', encoding='utf8')
lists = file.readlines()
print(lists)
print(type(lists))
file.close()
['hello world\n', '你好世界\n', '测试\n', '文件\n', '读写\n', '\n', '上面是空行']
<class 'list'>
4. 使用上下文管理器
当打开文件之后,有的时候老是忘记关闭文件对象,于是Python提供了上下文管理器,来帮助程序员自动关闭文件(类似于Java的try)
- 使用
with 语句打开文件 - 当
with 内部的代码块执行完毕后, 就会自动调用关闭方法
with open('D:/root/test.txt', 'r', encoding='utf8') as file:
lines = file.readline()
print(lines)
上下文管理器起到的效果就是一个监控,当 with对应的代码块执行完毕后,就会自动执行 文件对象的 close方法
5. 实现文件查找工具
指定一个待搜索的文件路径,同时指定一个要搜索的文件关键字 在待搜索路径中查找是否文件名中包含这个关键字
- 使用
os.walk 即可实现目录的递归遍历,不需要手动写递归 os.walk 返回一个三元组, 分别是 当前路径 , **当前路径下包含的目录名 **(多个), 当前路径下包含的文件名 (多个)
import os
path = input('请输入要搜索的绝对路径:')
keyword = input('请输入要查找的文件名的关键字:')
'''
dir_path:遍历到当前位置的绝对路径啥
dir_names:当前路径下都有哪些目录
file_names:当前目录下都有哪些文件(保存的是文件命名)
'''
for dir_path, dir_names, file_names in os.walk(path):
for f_name in file_names:
if keyword in f_name:
print(f'{dir_path}/{f_name}')
|