IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> python自动化办公数据分析的文件和目录操作(二) -> 正文阅读

[Python知识库]python自动化办公数据分析的文件和目录操作(二)

当前工作目录
前面用到open函数,其必填参数是file。如果文件就在Python程序所在的目录,就可以不写文件路径。我们看一下当前脚本的工作目录。>>> import os

os.getcwd()
‘C:\Users\Administrator’
如果工作目录和文件所在目录不一致,就需要写出文件的完整路径才能正确读取文件。我们也可以修改当前脚本的工作目录。>>> os.chdir(r’H:\示例\第3章’)

os.getcwd()
‘H:\示例\第3章’
修改以后,该文件夹下的文件都只需要写文件名即可读取。保存文件也是默认保存到当前工作目录。
通过os.listdir()方法可以获取当前目录的全部文件和子目录。>>> os.listdir()
[‘Python之禅.txt’, ‘Python之禅.doc’, ‘Python之禅.jpg’, ‘子文件夹’]
遍历文件目录
os.listdir()方法不能获取子目录里面的文件,要进一步获取则需要用到os.walk方法。下面是常用的遍历一个文件夹的代码,它可以列出文件夹及其子目录的所有文件。>>> import os

path=r’H:\示例\第3章’
for foldName, subfolders, filenames in os.walk(path):
… for filename in filenames:
… print(foldName,filename)

H:\示例\第3章Python之禅.txt
H:\示例\第3章Python之禅.doc
H:\示例\第3章Python之禅.jpg
H:\示例\第3章\子文件夹Python之禅.txt
foldName是文件目录,filename是文件名。可以用os.path.join(foldName,filename)来获取文件的绝对路径。>>> os.path.join(foldName,filename)
‘H:\示例\第3章\子文件夹\Python之禅.txt’
文件路径管理
操作文件目录时,常常需要对路径进行拆分组合。
下面对一个绝对路径文件名进行拆分。>>> path=‘C:\ProgramData\Anaconda3\Lib\site-packages\PyPDF2\pdf.py’

os.path.split(path)
‘C:\ProgramData\Anaconda3\Lib\site-packages\PyPDF2’, ‘pdf.py’)

os.path.dirname(path)
‘C:\ProgramData\Anaconda3\Lib\site-packages\PyPDF2’

os.path.basename(path)
‘pdf.py’

os.path.splitext(path)
(‘C:\ProgramData\Anaconda3\Lib\site-packages\PyPDF2\pdf’, ‘.py’)
还可以将文件名组合起来。>>> os.path.join(os.getcwd(),‘子文件夹’,os.path.basename(path))
‘H:\示例\第3章\子文件夹\pdf.py’
获取文件属性
os.path模块也包含若干函数,用来获取文件的属性,包括文件的创建时间、修改时间、文件的大小等。>>> path=r’H:\示例\第3章\Python之禅.txt’

os.path.getctime(path)
1595512609.77

os.path.getmtime(path)
1595521676.0

os.path.getatime(path)
1599148800.0
上述格式的时间表示从1970年1月1日到现在已经经过多少秒,要把它转换成可以理解的时间要使用time模块。>>> import time

time.ctime(os.path.getctime(path))
‘Thu Jul 23 21:56:49 2020’

time.ctime(os.path.getmtime(path))
‘Fri Jul 24 00:27:56 2020’

time.ctime(os.path.getatime(path))
‘Fri Sep 4 00:00:00 2020’
这里的创建时间,并不是指这个文件内容的原创时间,如果文件从别处复制过来,那就是复制的时间。
下面继续查看文件大小。>>> os.path.getsize(path)
100
使用stat方法获取文件的属性及状态信息。>>> os.stat(r’H:\示例\第3章\Python之禅.txt’)
os.stat_result(st_mode=33206, st_ino=13222019168, st_dev=3103564725, st_nlink=1, st_uid=0, st_gid=0,st_size=100, st_atime=1599148800, st_mtime=1595521676, st_ctime=1595512609)
st_atime表示最近访问的时间,以秒表示;st_mtime表示最近修改内容的时间,以秒表示;st_ctime表示文件创建的时间,以秒表示。
我们遍历文件夹,可以获取全部文件的属性,基于属性能更加精确地筛选和管理文件,例如根据文件大小、创建时间来分类管理文件。这里是获取文件的一般属性,对于特殊的文件(如照片),我们还可以用专门的模块来获取更多文件信息,例如地理位置经纬度等。我们可以将分散在不同文件夹的照片找出来,然后根据拍摄地点分类管理照片。
案例:删除小文件
在实际应用中,当我们批量下载网络文件时,有时候会下载许多无效文件,这些文件的特征是特别小。但是其中有些文件是TXT文档,本身就比较小。所以,我们需要找出其中不是TXT文档且小于2000字节的文件,通过下面的代码批量删除。for file in os.listdir():
path=os.path.abspath(file)
filesize=os.path.getsize(file)
if (filesize <2000) & (os.path.splitext(path)[1]!=’.txt’):
os.remove(file)
我们可以手动对文件按照大小排序,删除小文件。但是对于多条件甚至在多目录下批量删除特定文件,编程的优势就体现出来了。掌握了编程方法,可以满足更多复杂、个性化的需求。案例:批量更名
下面对文件夹里的所有文件更名,在文件名前面和后面都加上“2020”。>>> import os

path=r’H:\示例\第3章\批量更名’
for foldName, subfolders, filenames in os.walk(path):
… for filename in filenames:
… abspath=os.path.join(foldName,filename)
… extension=os.path.splitext(abspath)[1]
… new_name=filename.replace(extension,‘2020’+extension)
… new_name=‘2020’+new_name
… os.rename(abspath,os.path.join(foldName,new_name))
可以看到文件夹、子文件夹、子文件夹的子文件夹中的所有文件都被更名了

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-10-30 12:31:14  更:2021-10-30 12:33:07 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/16 0:01:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码