IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 【python】使用pandas做数据透视表,入门版 -> 正文阅读

[Python知识库]【python】使用pandas做数据透视表,入门版

使用到的模块

import pandas as pd
import numpy as np

先来看看原始的表格数据(数据无意义,只是用来做实验的呀)

获取到所有的值:
[[Timestamp('2021-07-01 00:00:00') 'France' 44.0 72000.0 'No']
 [Timestamp('2021-08-01 00:00:00') 'Spain' 27.0 48000.0 'Yes']
 [Timestamp('2021-07-01 00:00:00') 'Germany' 30.0 54000.0 'No']
 [Timestamp('2021-09-15 00:00:00') 'Spain' 38.0 61000.0 'No']
 [Timestamp('2021-09-15 00:00:00') 'Germany' 40.0 nan 'Yes']
 [Timestamp('2021-07-01 00:00:00') 'France' 35.0 58000.0 'Yes']
 [Timestamp('2021-08-01 00:00:00') 'Spain' nan 52000.0 'No']
 [Timestamp('2021-09-15 00:00:00') 'France' 48.0 79000.0 'Yes']
 [Timestamp('2021-09-15 00:00:00') 'Germany' 50.0 83000.0 'No']
 [Timestamp('2021-07-01 00:00:00') 'France' 37.0 67000.0 'Yes']]

取5个样本数据,

print(df.sample(5))

输出:

        Date  Country   Age   Salary Purchased
8 2021-09-15  Germany  50.0  83000.0        No
3 2021-09-15    Spain  38.0  61000.0        No
5 2021-07-01   France  35.0  58000.0       Yes
1 2021-08-01    Spain  27.0  48000.0       Yes
6 2021-08-01    Spain   NaN  52000.0        No

将时间按照月份统计,并取5个样本看看效果:

df.insert(1,"月份",df["Date"].apply(lambda x:x.month))
print(df.sample(5))
        Date  月份  Country   Age   Salary Purchased
9 2021-07-01   7   France  37.0  67000.0       Yes
6 2021-08-01   8    Spain   NaN  52000.0        No
7 2021-09-15   9   France  48.0  79000.0       Yes
2 2021-07-01   7  Germany  30.0  54000.0        No
3 2021-09-15   9    Spain  38.0  61000.0        No

PS:为什么需要取5个样本呢?

解答:遇到数据多的时候,只取样本看看效果可以节省时间

重头戏来了,使用python做数据透视表,按照月份统计各个城市的薪水总和

df1 = pd.pivot_table(df,index="Country",columns="月份",
    values="Salary",aggfunc=np.sum)
print(df1)

?结果展示:

月份              7         8        9
Country                             
France   197000.0       NaN  79000.0
Germany   54000.0       NaN  83000.0
Spain         NaN  100000.0  61000.0 
  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-07-25 11:36:25  更:2021-07-25 11:37:29 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/25 14:16:07-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计