| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> Pandas中read_excel函数参数使用详解+实例代码 -> 正文阅读 |
|
[人工智能]Pandas中read_excel函数参数使用详解+实例代码 |
目录 前言使用Pandas进行数据预处理时需要了解Pandas的基础数据结构Series和DataFrame。若是还不清楚的可以再去看看我之前的三篇博客详细介绍这两种数据结构的处理方法: DataFrame多表合并拼接函数concat、merge参数详解+代码操作展示 以上三篇均为基础知识,没有比较难的实战,比较容易学会。 首先说明一点,关于包含在异常值里面的空值和重复值均有两篇博客专门详细介绍了处理他们的方法: 该篇博客主要详解读取Excel表函数read的各种参数的用法 此篇博客基于Jupyter之上进行演示,本篇博客的愿景是希望我或者读者通过阅读这篇博客能够学会方法并能实际运用,而且能够记录到你的思想之中。希望读者看完能够提出错误或者看法,博主会长期维护博客做及时更新。纯分享,希望大家喜欢。 一、数据展示为方便演示函数效果这里创建一个excel文件,其中创建了两个表格: ?sheet2: 二、read_excel默认参数
1.ioio为文件类对象,一般作为读取文件的路径:
? 2.sheet_name该参数为指定读取excel的表格名 Sheet_name参数莫仍从零开始,也就是想读第二张表则将参数改为1即可:
? 也可以设定值为列表,则一次返回一个字典:
? 3.header该参数为指定列表中从第几行作为列索引:
? 如果设定为1则以第二行的数据作为列索引的值。 4.names此参数接收一个数组,将列名重定义赋值:
? 5.index_col此参数为指定从第几列开始索引:
? 6.usecols该参数为返回指定的列,usecols=[A,C]表示只选取A列和C列。usecols=[A,C:E]表示选择A列,C列、D列和E列;:
?
? 也可以传入列表:
?
? ?7.squeeze若处理excel仅仅只有一列时,此时设定为True将转换为Series:
? 8.dtype指定读取列的数据类型,可接收字典:
? 若指定了“converters”参数,则dtype函数失效。 9.engine该参数为指定Excel处理引擎,一般Excel处理引擎为xlrd,openpyxl,odf:
10.converters指定列数据类型转换函数,包括了dtype的功能,也可以对某一列使用Lambda函数,进行某种运算:
? 11.true_values,false_values传输一个列表判断为true或是false:
12.skiprows此参数为跳过行操作:
仅取偶数行:
? 13.nrow指定需要读取前多少行,通常用于较大的数据文件中。 excel=pd.read_excel(r"D:\Python\pythonlearn\test1.xlsx",nrows=3) 14.na_values将指定的值或者传入中的列表中的值设置为NaN:
? 15.keep_default_na作用:处理数据是否包含默认的NaN值 依赖于na_values参数是否被传递,默认为True,即自动识别空值导入。 16.na_filter作用:检测缺少的值标记。当数据中没有任何NA值时,na_filter设置为False可以提高处理速度,特别是处理大文件时。 17.verbose作用:指示放置在非数字列中NA值的数目 18.parse_dates作用:处理日期类数据 这个参数蛮有意思,这里我重新创建个表:
? 19.data_parser作用:设置处理日期数据的函数,利用lambda函数,将某个字符串列,解析为日期格式;
20.mangle_dupe_cols可以使用此是参数处理重复的列: 这里改动一下sheet2:
?结果: ValueError: Setting mangle_dupe_cols=False is not supported yet ?现在还不支持这个函数貌似 参阅:一个参数一张Excel表,玩转Pandas的read_excel()表格读取 easy excel date 类型解析报错_最新Pandas.read_excel()全参数详解(案例实操,如何利用python导入excel)... |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 8:42:08- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |