最近跑数据跑到头秃,不得已只好将python自动化办公玩出花样,可以将两三个小时的工作量缩短到十几分钟,最重要的是:心情好!不需要闹心的搞重复性的工作,几行代码剩下的交给程序自己跑。
教程部分: 用到的库:os 1.遍历某个目录中的所有文件夹
import os
rootdir = r'D:\input\test'
list1 = os.listdir(rootdir)
list1
out:['test1',
'test10',
'test11',
'test12',
'test2',
'test3',
'test4',
'test5',
'test6',
'test7',
'test8',
'test9']
原始文件如图: 2.遍历文件夹中的全部文件 其实用的方法跟前面一样
import os
rootdir = r'D:\input\10min'
list1 = os.listdir(rootdir)
list1
out:
['数据采集1.xlsx',
'数据采集10.xlsx',
'数据采集11.xlsx',
'数据采集12.xlsx',
'数据采集13.xlsx',
'数据采集14.xlsx',
'数据采集15.xlsx',
'数据采集2.xlsx',
'数据采集3.xlsx',
'数据采集4.xlsx',
'数据采集5.xlsx',
'数据采集6.xlsx',
'数据采集7.xlsx',
'数据采集8.xlsx',
'数据采集9.xlsx']
原始文件夹如下: 3.应用 主要是用os库遍历路径中的文件,返回包含文件名的列表,然后通过for循环遍历这些文件地址,再通过pandas库读取文件,进行后续的文件操作:删除、插入、数据处理、保存结果等。 上代码:
import os
import pandas as pd
rootdir = r'D:\input\10min'
list1 = os.listdir(rootdir)
for i in range(len(list1)):
df=pd.read_excel(rootdir+'\{}'.format(list1[i]))
print(df.head(5))
4.多个文件夹、多个表格操作 如果涉及到很多文件夹,每个文件夹中有很多个表格需批量处理,怎么办呢? 再套一层for循环,地址改一改就可以了。
|