python批量处理excel提取包含指定关键字的行

当我们有大量excel表格需要批处理，目标为提取包含指定关键字的行，可用本文代码，环境为windows

python依赖安装

安装好python后，在windows cmd窗口输入

pip install xlrd==1.2.0
pip install openpyxl==3.0.9
pip install xlrd==1.2.0

如果显示没有pip，先安装pip

可复用的批量读取代码

循环遍历，提取dirpath文件夹中的excel文件

##遍历函数
def files(dirpath, suffix=['.xls', 'xlsx']):
    for root ,dirs ,files in os.walk(dirpath):
        for name in files:
            if name.split('.')[-1] in suffix:
                yield os.path.join(root, name)

整体代码

使用时修改dirpath和keyword即可，结果文件存在运行目录下的jieguo.xls

import os
import xlwt
import xlrd
from openpyxl import load_workbook

##目的文件夹
dirpath=r'D:\aaaaaaa'
keyword='小张'

##遍历函数
def files(dirpath, suffix=['.xls', 'xlsx']):
    for root ,dirs ,files in os.walk(dirpath):
        for name in files:
            if name.split('.')[-1] in suffix:
                yield os.path.join(root, name)

if __name__ == '__main__':

    jieguo = xlwt.Workbook(encoding="ascii")  #生成excel
    wsheet = jieguo.add_sheet('sheet name') #生成sheet    
    y=0 #生成的excel的行计数
    try:
        file_list = files(dirpath)
        for filename in file_list:
            workbook = xlrd.open_workbook(filename) #读取源excel文件
            print(filename)
            sheetnum=workbook.nsheets  #获取源文件sheet数目
            for m in range(0,sheetnum):
                sheet = workbook.sheet_by_index(m) #读取源excel文件第m个sheet的内容
                nrowsnum=sheet.nrows  #获取该sheet的行数
                for i in range(0,nrowsnum):
                    date=sheet.row(i) #获取该sheet第i行的内容
                    for n in range(0,len(date)):
                        aaa=str(date[n]) #把该行第n个单元格转化为字符串，目的是下一步的关键字比对
                        print(aaa)
                        if aaa.find(keyword)>0: #进行关键字比对，包含关键字返回1，否则返回0
                            y=y+1
                            for j in range(len(date)):
                                wsheet.write(y,j,sheet.cell_value(i,j)) #该行包含关键字，则把它所有单元格依次写入入新生成的excel的第y行
        jieguo.save('jieguo.xls') #保存新生成的Excel
    except Exception as e:
        print(e)


 
                     
    jieguo.save('jieguo.xls') #保存新生成的Excel

开发工具最新文章

Postman接口测试之Mock快速入门

ASCII码空格替换查表_最全ASCII码对照表0-2

如何使用 ssh 建立 socks 代理

Typora配合PicGo阿里云图床配置

SoapUI、Jmeter、Postman三种接口测试工具的

github用相对路径显示图片_GitHub 中 readm

Windows编译g2o及其g2o viewer

解决jupyter notebook无法连接/ jupyter连接

Git恢复到之前版本

VScode常用快捷键

加:2021-11-30 15:49:24 更:2021-11-30 15:49:36

360图书馆购物三丰科技阅读网日历万年历 2026年3日历

-2026/3/24 21:44:33-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码