| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> Python知识库 -> python 处理 dataframe的汇总 -> 正文阅读 |
|
[Python知识库]python 处理 dataframe的汇总 |
0 处理异常 1 替换 示例
运行结果如下:
既可以将对满足条件的行和列的数据替换,也可以对整个集合的数据按照条件进行替换。
将总分列的数值“310”替换为“x”。inplace=True表示改变原数据。
将整个DataFrame中的数值“76”替换为“0”。
将整个DataFrame中的数值“98,76,99”一次替换为“0”。 2 排序 函数sort_values()的语法格式如下:
其中,coln表示列名,也可以是列名的列表;ascending表示排序方式,值为True表示升序,可以省缺,值为False表示降序。 如:
表示按照“总分”从高到低排序。
表示按照“总分”从高到低排序,若“总分”相同,再按照“语文”成绩从高到低排序。 字段截取
其中,start表示开始位置;stop表示结束位置 例:
通过此语句可以截取学号字段的第1、2个字符,并赋值给年级字段。 21.4 记录抽取 可以抽取满足条件的记录。 例:抽取总分>300的记录。
抽取总分在300到310之间(包括300和310)的记录。
抽取学号中包含“0803”的记录。这样可以非常方便的抽取某个班的信息。
此处的na=False,含义是如遇到NaN这样的数据,直接做不匹配处理。 21.5修改记录 1、整列替换 我们在前面已经给整列填充过数据,填充时原来的数据就被覆盖了。 即如下语句:
2、个别修改 如将值‘99’替换为值‘100’,可用如下语句:
将指定列的值替,如将语文列和英语列的值‘99’替换为值‘100’,可用如下语句:
可用如下程序去验证:
运行结果为:
可以看出,第一个print()语句输出的结果中满足条件“语文或英语为99分”的有两条记录,替换语句执行以后,df中再没有满足条件“语文或英语为99分”的记录了。 21.6记录合并 函数concat()的格式如下:
其中,dataFrame1等表示要合并的DataFrame数据集合;ignore_index=True表示合并之后的重新建立索引。其返回值也是DataFrame类型。 concat()函数和append()函数的功能非常相似。 例:
运行结果如下: 序号 学号 姓名 年级 班级 语文 数学 英语 总分 名次
由于合并时是将df1合并到df2中,可以看出,索引仍然保持原来的状态。 21.7统计次数 可以用如下方法统计出某个值在某行或者某个范围出现的次数。
输出结果如下: 序号 学号 姓名 年级 班级 语文 数学 英语 总分 名次
可以看出,通过value_counts()函数可以统计出列中各值出现的次数。 value_counts()函数的参数还有 : ascending,当ascending=True时升序排列,当ascending=False时升序排列(此时该参数可省缺); normalize,当normalize=True时,显示的不再是各值出现的次数,而是占比。 将上例中的语句print(df[‘语文’].value_counts())改为:
则输出结果变成了:
21.8按值查找
它的作用是查找‘语文’列中值和isin所指的列表中元素一致的记录,如果找到结果为True,否则为False。 输出结果:
21.9数据分区 根据某个分区标准,将数据按照所属区域进行划分,并用相应的标签表示,可以用cut()方法来实现。 语法格式如下:
其中: series表示需要分组的数据; bins表示分组的依据,是一个列表,其元素为划分分区的边界值,如[0,72,96,120],就是划分3个分区,即072、7296、96~120,默认的是“左包右不包”; right表示分组时右边是否闭合; labels表示分组的自定义标签,也可以不重新定义。 下面对上述学生成绩表中的语文成绩进行分组,并增加一个新的列“语文等级”。
运行结果如下:
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/15 11:33:06- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |