[Python知识库] 【python】使用pandas做数据透视表，入门版

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> Python知识库 -> 【python】使用pandas做数据透视表，入门版 -> 正文阅读

[Python知识库]【python】使用pandas做数据透视表，入门版

使用到的模块

import pandas as pd
import numpy as np

先来看看原始的表格数据（数据无意义，只是用来做实验的呀）

获取到所有的值:
[[Timestamp('2021-07-01 00:00:00') 'France' 44.0 72000.0 'No']
 [Timestamp('2021-08-01 00:00:00') 'Spain' 27.0 48000.0 'Yes']
 [Timestamp('2021-07-01 00:00:00') 'Germany' 30.0 54000.0 'No']
 [Timestamp('2021-09-15 00:00:00') 'Spain' 38.0 61000.0 'No']
 [Timestamp('2021-09-15 00:00:00') 'Germany' 40.0 nan 'Yes']
 [Timestamp('2021-07-01 00:00:00') 'France' 35.0 58000.0 'Yes']
 [Timestamp('2021-08-01 00:00:00') 'Spain' nan 52000.0 'No']
 [Timestamp('2021-09-15 00:00:00') 'France' 48.0 79000.0 'Yes']
 [Timestamp('2021-09-15 00:00:00') 'Germany' 50.0 83000.0 'No']
 [Timestamp('2021-07-01 00:00:00') 'France' 37.0 67000.0 'Yes']]

取5个样本数据，

print(df.sample(5))

输出：

        Date  Country   Age   Salary Purchased
8 2021-09-15  Germany  50.0  83000.0        No
3 2021-09-15    Spain  38.0  61000.0        No
5 2021-07-01   France  35.0  58000.0       Yes
1 2021-08-01    Spain  27.0  48000.0       Yes
6 2021-08-01    Spain   NaN  52000.0        No

将时间按照月份统计，并取5个样本看看效果：

df.insert(1,"月份",df["Date"].apply(lambda x:x.month))
print(df.sample(5))

        Date  月份  Country   Age   Salary Purchased
9 2021-07-01   7   France  37.0  67000.0       Yes
6 2021-08-01   8    Spain   NaN  52000.0        No
7 2021-09-15   9   France  48.0  79000.0       Yes
2 2021-07-01   7  Germany  30.0  54000.0        No
3 2021-09-15   9    Spain  38.0  61000.0        No

PS：为什么需要取5个样本呢？

解答：遇到数据多的时候，只取样本看看效果可以节省时间

重头戏来了，使用python做数据透视表，按照月份统计各个城市的薪水总和

df1 = pd.pivot_table(df,index="Country",columns="月份",
    values="Salary",aggfunc=np.sum)
print(df1)

?结果展示：

月份              7         8        9
Country                             
France   197000.0       NaN  79000.0
Germany   54000.0       NaN  83000.0
Spain         NaN  100000.0  61000.0

Python知识库最新文章

Python中String模块

【Python】 14-CVS文件操作

python的panda库读写文件

使用Nordic的nrf52840实现蓝牙DFU过程

【Python学习记录】numpy数组用法整理

Python学习笔记

python字符串和列表

python如何从txt文件中解析出有效的数据

Python编程从入门到实践自学/3.1-3.2

python变量

加:2021-07-25 11:36:25 更:2021-07-25 11:37:29

360图书馆购物三丰科技阅读网日历万年历 2026年4日历

-2026/4/22 17:26:07-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码