IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 自动识别编码格式读取数据with open;argparse命令行输入参数;logger日志的设置; -> 正文阅读

[Python知识库]自动识别编码格式读取数据with open;argparse命令行输入参数;logger日志的设置;

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2022/4/11 下午1:51
# @Author  : LiSi
# @File    : test.py
# @Software: PyCharm
import os
import chardet
import logging
import argparse
import pandas as pd
import numpy as np

class UploadData:
    def __init__(self,filePath):
        self.filePath = filePath
        self.filePathList = self.get_file_list()
        self.logger = Logger(
            log_file_name=opt.log_path + "/log.txt",
            log_level=logging.DEBUG,
            logger_name="test",
        ).get_log()

    def get_file_list(self):
        self.PathList = os.listdir(self.filePath)
        self.filePathList = list(filter(lambda x: True if type(x) == str and len(x) > 0 and x[-3:] == ".rb" else False, self.PathList))
        return self.filePathList

    def get_txt(self):
        if len(self.filePathList)>0:
            for i,filename in enumerate(self.filePathList):
                self.logger.info('正在解析读取第{}个文件...'.format(i+1))
                #读取
                with open(self.filePath+'/'+filename, 'rb') as f:
                    r = f.read()
                    f_charInfo = chardet.detect(r)  #获取文本编码信息  #'GB2312'
                    str_txt0 = r.decode(f_charInfo['encoding'])
                    str_txt = str_txt0.split('\r\n')
                    #日期
                    date = list(filter(lambda x: True if ('date' in x) or('time' in x) else False,str_txt0.split('\t')))[0]
                    date_str = date.split('=')[1]
                    print(date_str)

                    #提取flag标志文本,例如 </风电检修容量日报::山东.安城大唐风电 date='2018-08-11'> 中的  风电检修容量日报::山东.安城大唐风电
                    last_flag = str_txt[-1][:-2].split(' ')[0]
                    last_flag = last_flag.split('/')[-1] if '/'in last_flag else last_flag.split('<')[-1]
                    #文档主体
                    txt_body= list(filter(lambda x: True if last_flag not in x else False,str_txt))
                    txt_body = list(map(lambda x:x.replace('@','').split('\t'),txt_body))
                    #数据—dataframe
                    data_df = pd.DataFrame(txt_body[1:],columns=txt_body[0])
                    print(data_df.head())

        else:
            raise Exception('无有效文件,无法解析数据!')




class Logger(object):
    def __init__(self, log_file_name, log_level, logger_name):
        # firstly, create a logger
        self.__logger = logging.getLogger(logger_name)
        self.__logger.setLevel(log_level)
        # secondly, create a handler
        file_handler = logging.FileHandler(log_file_name)
        console_handler = logging.StreamHandler()
        # thirdly, define the output form of handler
        formatter = logging.Formatter(
            "[%(asctime)s]-[%(filename)s line:%(lineno)d]:%(message)s "
        )
        file_handler.setFormatter(formatter)
        console_handler.setFormatter(formatter)
        # finally, add the Hander to logger
        self.__logger.addHandler(file_handler)
        self.__logger.addHandler(console_handler)

    def get_log(self):
        return self.__logger

if __name__ == '__main__':
    global logger
    parser=argparse.ArgumentParser()
    parser.add_argument(
        '--file_path',
        type=str,
        default='./',
        help='files set path'
    )
    parser.add_argument(
        '--log_path',
        type=str,
        default='./',
        help='log files set psth'
    )
    opt = parser.parse_args()
    FilePath = opt.file_path

    #调用
    UploadData(FilePath).get_txt()








  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-04-18 17:36:49  更:2022-04-18 17:42:03 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 17:20:49-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码