Pandas模块提供实现透视表功能的pivot_table函数
pd.pivot_table(data,values=None,index=None,
columns=None,aggfunc='mean',fill_value=None,
margins=False,dropna=True,margins_name='All')
- data:指定需要构造透视表的数据
- values:指定需要拉入“数值”框的字段列表
- index:......“行标签”......
- columns:......"列标签"......
- aggfunc:指定数值的统计函数,默认为统计均值,也可以指定numpy模块中的其他统计函数
- fill_value: 指定一个标量,用于填充缺失值
- margins:bool类型参数,是否需要显示行或列的总计值,默认False
- dropna:bool型,是否删除整列为删除的字段,默认True
- margins_name:指定行或列的总计名称,默认为All
# 数据读取
diamonds = pd.read_table(r'''C:\Users\yu'chuan'zhao\Desktop\pythondatacourse\第5章 Python数据处理工具--Pandas\diamonds.csv''', sep = ',')
# 两个分组变量的列联表
# 导入numpy模块
import numpy as np
pd.pivot_table(data = diamonds, index = 'clarity', columns = 'cut', values = 'carat',
aggfunc = np.size,margins = True, margins_name = '总计')
?
?
|