🥇预备知识
??os库
os.path.exists()
os模块中的os.path.exists()方法用于检验文件是否存在。 如果不存在返回False ,存在则返回True
- 判断文件是否存在
import os os.path.exists(test_file.txt)
- 判断文件夹是否存在
import os os.path.exists(test_dir)
os.mkdir()
os.mkdir() 方法用于以数字权限模式创建目录。用法:os.mkdir(path[, mode])
- path – 要创建的目录,可以是相对或者绝对路径。
- mode – 要为目录设置的权限数字模式。
- 创建相对路径下的文件夹
import os path = “./file1” os.mkdir( path)
- 创建绝对路径下的文件夹
import os path = “D:\file1” os.mkdir( path)
os.remove()
在Python中可以使用os.remove()函数删除文件(注意一定是一个文件)。 其原型如下所示:os.remov(path) 其参数path 为要删除的文件的路径。
- 如删除D盘下books目录下book目录中的book.txt的文件
import os
os.remove('d:\\books\\book\\book.txt')
os.listdir()
该函数返回指定路径下,文件和文件夹组成的列表
👽Python 3 查看字符编码方法
查看字符编码,需要用到chardet模块 TIp:chardet.detect 在查看字符串传的编码时,必须要把字符串encode后,才能查看当前字符串编码格式
?python3获取当前系统时间
import time
print('时间显示')
for i in range(3):
print(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())))
time.sleep(1)
'''
python中时间日期格式化符号:
%y 两位数的年份表示(00-99)
%Y 四位数的年份表示(000-9999)
%m 月份(01-12)
%d 月内中的一天(0-31)
%H 24小时制小时数(0-23)
%I 12小时制小时数(01-12)
%M 分钟数(00=59)
%S 秒(00-59)
%a 本地简化星期名称
%A 本地完整星期名称
%b 本地简化的月份名称
%B 本地完整的月份名称
%c 本地相应的日期表示和时间表示
%j 年内的一天(001-366)
%p 本地A.M.或P.M.的等价符
%U 一年中的星期数(00-53)星期天为星期的开始
%w 星期(0-6),星期天为星期的开始
%W 一年中的星期数(00-53)星期一为星期的开始
%x 本地相应的日期表示
%X 本地相应的时间表示
%Z 当前时区的名称
%% %号本身
'''
``
🐤读取图片,保存到指定目录
使用到了python中的PIL(pillow) 和 os库
👼将数据保存到csv文件中
header_list = ["图片路径","姓名"]
data_list = []
for i in range(len(errorImage)):
tempList = []
tempList.append(errorImage[i])
errorName = re.search(r'\\.*\.', errorImage[i])
errorName = errorName.group().replace("\\", "")
errorName = errorName.replace('.','')
tempList.append(errorName)
data_list.append(tempList)
with open("notSubmitData.csv", mode="w", encoding="utf-8-sig", newline="") as f:
writer = csv.writer(f)
writer.writerow(header_list)
writer.writerows(data_list)
🥈python实现文字识别
🚗Tesseract
文字识别是ORC的一部分内容,ORC的意思是光学字符识别,通俗讲就是文字识别。Tesseract是一个用于文字识别的工具,我们结合Python使用可以很快的实现文字识别。但是在此之前我们需要完成一个繁琐的工作。
关于配置Tesseract 可以移步到这个博客:Python识别图片中的文字
注意点:
- 下载之后记得先运行再去配置系统变量。
- 所在目录有中文也没有关系。
- 如果没有该添加中文语言包会无法识别出中文。
🥉python中解压rar和zip文件
🚄rar文件
Python下的unrar还依赖RAR官方的库。因为我们用pip导入包之后还需要配置相应的环境。
- 更多关于使用unrar可以去这里:unrar
rf = rarfile.RarFile(_rarfile, mode='r')
rf_list = rf.namelist()
print('rar文件内容', rf_list)
for f in rf_list:
rf.extract(f, folder_abs)
解压rar文件不会出现解压之后文件名中文乱码现象。
🌵zip
使用zipfile模块, ZIP 文件格式是一个常用的归档与压缩标准。 这个模块提供了创建、读取、写入、添加及列出 ZIP 文件的工具。 官网介绍链接
- pip 安装命令:
pip install zipfile - 基本操作
import zipfile
'''
基本格式:zipfile.ZipFile(filename[,mode[,compression[,allowZip64]]])
mode:可选 r,w,a 代表不同的打开文件的方式;r 只读;w 重写;a 添加
compression:指出这个 zipfile 用什么压缩方法,默认是 ZIP_STORED,另一种选择是 ZIP_DEFLATED;
allowZip64:bool型变量,当设置为True时可以创建大于 2G 的 zip 文件,默认值 True;
'''
zip_file = zipfile.ZipFile(path)
zip_list = zip_file.namelist()
for f in zip_list:
zip_file.extract(f, folder_abs)
zip_file.close()
Python解压缩ZIP文件出现乱码问题的解决方案
原因:原来编码不能被正确识别为utf-8的时候,会被是被识别并decode为cp437编码,如果原来是gbk编码的话就会变成乱码。
解决方法:解决的办法也很简单,那就是将文件名先使用cp437编码encode,然后再用gbk编码decode即可。
for file in zip_file_contents.namelist():
filename = file.encode('cp437').decode('gbk')
zip_file_contents.extract(file, release_file_dir)
os.chdir(release_file_dir)
os.rename(file, filename)
os.chdir(retval)
🐗利用Pycharm将python文件打包为exe文件
1、PyInstaller简介
PyInstaller是一个跨平台的Python应用打包工具,支持 Windows/Linux/MacOS三大主流平台,能够把 Python 脚本及其所在的 Python 解释器打包成可执行文件,从而允许最终用户在无需安装 Python 的情况下执行应用程序。 PyInstaller 制作出来的执行文件并不是跨平台的,如果需要为不同平台打包,就要在相应平台上运行PyInstaller进行打包。
2、PyInstaller安装
pip install Pyinstaller
3、利用PyInstaller对pycharm中的python文件进行打包:利用Pycharm将python文件打包为exe文件(超详细,附带如何设置文件图标)
💔自动检验核酸展示
原始文件:
- Images中存放要识别的图片
里边为一个压缩包
开始处理,
- 将Images中的压缩包进行解压
- errorImages 存放的是不符合条件的图片
- imagePath为图片路径。
- notSubmitData 存放的是不符合条件的人员名单
参考文章:
- 添加链接描述
- zip中文乱码
|