IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> matplotlib绘图 -> 正文阅读

[Python知识库]matplotlib绘图

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 解决中?显示问题
plt.rcParams['font.sans-serif'] = [u'SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 等差数列
x = np.linspace(0,10,100)
y1 = np.sin(x)
y2 = np.cos(x)

plt.plot(x,y,ls=,lw=,c=,marker=,markersize=,markeredgecolor=,markerfacecolor, label=)

  • x: x轴上的数值

  • y: y轴上的数值

  • ls: 折线的风格(‘-‘, ’–‘, ’-.‘和’:‘)

  • lw: 线条宽度

  • c: 颜色

  • marker: 线条上点的形状

  • markersize: 线条上点的形状大小

  • markeredgecolor: 点的边框色

  • markerfacecolor: 点的填充色

  • label: 文本标签

  • 添加文本: 使用plt.title添加标题, 使用plt.xlabel()和ylabel()添加轴标签

  • 添加图例: 使用plt.legend()将图例说明添加到图表中

  • 添加网格: 使用plt.grid()绘制网格线

  • 保存图形: 使用plt.savefig()可以将图形保存为pdf或者其他格式

  • 绘制参考线: 使用plt.axhline和plt.axvline绘制参考线

图例legend中loc中的位置和数字关系的使用

  • ‘best’ 0
  • ‘upper rught’ 1
  • ‘upper left’ 2
  • ‘lower left’ 3
  • ‘lower right’ 4
  • ‘right’ 5
  • ‘center left’ 6
  • ‘center right’ 7
plt.figure(figsize=(20,8),dpi=80)
plt.plot(x,y1,c='red',lw=2,ls='-',marker='o',markersize=6,markeredgecolor='red',markerfacecolor='yellow',label='y=sin(x)')
plt.plot(x,y2,c='c',lw=2,ls='--',marker='*',markersize=6,markeredgecolor='c',markerfacecolor='y',label='y=cos(x)')
plt.text(6,0.2,'sin(x)',weight='bold',color='red',fontsize=14)
plt.text(5,0.2,'cos(x)',weight='bold',color='c',fontsize=14)
plt.title('y=sin(x)、cos(x)')
plt.xlabel('X')
plt.ylabel('Y')
plt.legend(loc=1,fontsize=12)
plt.grid(ls='--',c='blue')
plt.show()

在这里插入图片描述

data = pd.read_csv(r'E:\python\Python数据分析与挖掘从零开始到实战\数据分析篇\学习笔记\数据\air_data.csv')
data.head()
MEMBER_NOFFP_DATEFIRST_FLIGHT_DATEGENDERFFP_TIERWORK_CITYWORK_PROVINCEWORK_COUNTRYAGELOAD_TIME...ADD_Point_SUMEli_Add_Point_SumL1Y_ELi_Add_PointsPoints_SumL1Y_Points_SumRation_L1Y_Flight_CountRation_P1Y_Flight_CountRation_P1Y_BPSRation_L1Y_BPSPoint_NotFlight
0549932006/11/22008/12/246.北京CN31.02014/3/31...399921144521111006197603702110.5095240.4904760.4872210.51277750
1280652007/2/192007/8/36NaN北京CN42.02014/3/31...1200053288532884157682384100.5142860.4857140.4892890.51070833
2551062007/2/12007/8/306.北京CN40.02014/3/31...1549155202517114063612337980.5185190.4814810.4814670.51853026
3211892008/8/222008/8/235Los AngelesCAUS64.02014/3/31...034890348903722041861000.4347830.5652170.5517220.44827512
4395462009/4/102009/4/156贵阳贵州CN48.02014/3/31...2270464969649693388132103650.5328950.4671050.4690540.53094339

5 rows × 44 columns

# FFP_DATE数据转换
data['FFP_DATE'] = pd.to_datetime(data['FFP_DATE'],format='%Y/%m/%d',errors='coerce')
data.head()
MEMBER_NOFFP_DATEFIRST_FLIGHT_DATEGENDERFFP_TIERWORK_CITYWORK_PROVINCEWORK_COUNTRYAGELOAD_TIME...ADD_Point_SUMEli_Add_Point_SumL1Y_ELi_Add_PointsPoints_SumL1Y_Points_SumRation_L1Y_Flight_CountRation_P1Y_Flight_CountRation_P1Y_BPSRation_L1Y_BPSPoint_NotFlight
0549932006-11-022008/12/246.北京CN31.02014/3/31...399921144521111006197603702110.5095240.4904760.4872210.51277750
1280652007-02-192007/8/36NaN北京CN42.02014/3/31...1200053288532884157682384100.5142860.4857140.4892890.51070833
2551062007-02-012007/8/306.北京CN40.02014/3/31...1549155202517114063612337980.5185190.4814810.4814670.51853026
3211892008-08-222008/8/235Los AngelesCAUS64.02014/3/31...034890348903722041861000.4347830.5652170.5517220.44827512
4395462009-04-102009/4/156贵阳贵州CN48.02014/3/31...2270464969649693388132103650.5328950.4671050.4690540.53094339

5 rows × 44 columns

每年注册人数

data1 = data.groupby(data['FFP_DATE'].dt.year)['MEMBER_NO'].count()

绘制参考线

plt.figure(figsize=(20,8),dpi=80)
plt.plot(data1.index,data1.values,label='不同年份会员注册数')
plt.legend(loc='best')
# 绘制参考线
plt.axhline(y=5000,c='r',ls='--',lw=2)
plt.axvline(x=2012,c='r',ls='--',lw=2)
# 保存图形
plt.savefig('001')
plt.show()

在这里插入图片描述

绘制参考区域

plt.figure(figsize=(20,8),dpi=80)
plt.plot(data1.index,data1.values,label='不同年份会员注册数')
plt.legend(loc='best')
# 绘制参考区域
plt.axvspan(xmin=2016,xmax=2008,facecolor='red',alpha=0.6)
plt.axhspan(ymin=1250,ymax=5000,facecolor='yellow',alpha=0.3)
# 保存图形
plt.savefig('002')
plt.show()

在这里插入图片描述

常见图形绘制

df = pd.read_excel(r'E:\python\Python数据分析与挖掘从零开始到实战\数据分析篇\学习笔记\数据\sales_details.xlsx')
df.head()
创建日期物料编号应发库销售订单数量交货数量
02013.05.3010482258-00sz60.060.0
12013.05.3010261297-00sz3.03.0
22013.05.3010134443-00jn50.050.0
32013.05.3010195108-00jn20.020.0
42013.05.3010261297-00jn1.01.0
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 423214 entries, 0 to 423213
Data columns (total 5 columns):
 #   Column  Non-Null Count   Dtype  
---  ------  --------------   -----  
 0   创建日期    423213 non-null  object 
 1   物料编号    423213 non-null  object 
 2   应发库     423213 non-null  object 
 3   销售订单数量  423213 non-null  float64
 4     交货数量  423213 non-null  float64
dtypes: float64(2), object(3)
memory usage: 16.1+ MB
df.columns
Index(['创建日期', '物料编号', '应发库', '销售订单数量', '  交货数量'], dtype='object')
df.rename(columns={'  交货数量':'交货数量'},inplace=True)
df.columns
Index(['创建日期', '物料编号', '应发库', '销售订单数量', '交货数量'], dtype='object')
# 获取年份
df['年份'] = df['创建日期'].str.split('.',expand=True)[0]
df.head()
创建日期物料编号应发库销售订单数量交货数量年份
02013.05.3010482258-00sz60.060.02013
12013.05.3010261297-00sz3.03.02013
22013.05.3010134443-00jn50.050.02013
32013.05.3010195108-00jn20.020.02013
42013.05.3010261297-00jn1.01.02013
# 修改类型
df['创建日期'] = pd.to_datetime(df['创建日期'],format ='%Y.%m.%d',errors = 'coerce')
# 按照年份计算订单频次,一条数据代表一次订单频次
data_bak = df.groupby(['年份'])['物料编号'].count()
data_bak
年份
2013     50489
2014    110831
2015    177040
2016     84853
Name: 物料编号, dtype: int64
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 423214 entries, 0 to 423213
Data columns (total 6 columns):
 #   Column  Non-Null Count   Dtype         
---  ------  --------------   -----         
 0   创建日期    423213 non-null  datetime64[ns]
 1   物料编号    423213 non-null  object        
 2   应发库     423213 non-null  object        
 3   销售订单数量  423213 non-null  float64       
 4   交货数量    423213 non-null  float64       
 5   年份      423213 non-null  object        
dtypes: datetime64[ns](1), float64(2), object(3)
memory usage: 19.4+ MB
df.head()
创建日期物料编号应发库销售订单数量交货数量年份
02013-05-3010482258-00sz60.060.02013
12013-05-3010261297-00sz3.03.02013
22013-05-3010134443-00jn50.050.02013
32013-05-3010195108-00jn20.020.02013
42013-05-3010261297-00jn1.01.02013
# 获取年份
df['创建日期'].dt.year
0         2013.0
1         2013.0
2         2013.0
3         2013.0
4         2013.0
           ...  
423209    2015.0
423210    2015.0
423211    2015.0
423212    2016.0
423213    2016.0
Name: 创建日期, Length: 423214, dtype: float64
# 按照年份计算订单频次,一条数据代表一次订单频次
data = df.groupby(df['创建日期'].dt.year).size()
data
创建日期
2013.0     50489
2014.0    110831
2015.0    177040
2016.0     84853
dtype: int64
data.index = data.index.astype(int)
data
创建日期
2013     50489
2014    110831
2015    177040
2016     84853
dtype: int64

1、饼图

饼图用于实现可视化离散型变量的分布的一种图形

  • pie(x, explode,labels,colors,autopct,pctdistance,shadow,startangle,radius,wedgeprops,textprops,center)
  • –labels: 标签
  • –counterclock: 是否逆时针呈现:
  • –colors:颜色
  • –wedgeprops: 设置饼图内外边界的属性
  • –autopct: 百分比
  • –textprops: 设置饼图中文本属性
  • –pctdistance: 百分比标签与圆心距离
  • –center: 设置中心位置
  • –shadow: 是否添加饼图阴影效果
  • –labeldistance: 设置各扇形标签与圆心距离
  • –startangle: 设置饼图的初始摆放角度
  • –radius: 设置饼图半径大小
data_x = data.values
data_y = data.index
plt.figure(figsize=(20,8),dpi=80)
plt.axes(aspect='equal')  # 将横、纵坐标轴标准化处理,确保饼图是一个正圆,否则为椭圆
explode = [0,0.1,0,0]
plt.pie(data_x,# 绘图数据
        labels = data_y,# 添加标签
        explode = explode,# 突出显示
        colors = ['orchid','lightgreen','hotpink','green'],# 扇形颜色
        autopct = '%.2f%%', # 设置百分比格式
        pctdistance = 0.5,# 设置百分比到圆心的距离
        shadow = True,# 添加饼图阴影效果
        startangle = 240,# 设置饼图的初始摆放角度
        radius = 1.2, # 设置饼图半径大小
        wedgeprops = {'linewidth':'1.5','edgecolor':'gray'},# 设置饼图内外边界属性值
        textprops ={'fontsize':12,'color':'black'}, # 设置饼图中文本属性
        counterclock = False # 是否逆时针呈现
       )
plt.title('饼图-订单数量分布',pad=30,fontsize=14)
plt.legend(loc='best')
plt.show()

在这里插入图片描述

2、柱状图

柱状图(条形图)不仅适合分类水平较多的变量也更加适合对比差异

bar(x, height,width,bottom,color,linewidth,tick_label,align)

  • x: 指定x轴上数值
  • height: 指定y轴上数值
  • width: 指定条形图宽度
  • color: 条形图的填充色
  • edge: 条形图的边框色
  • bottom: 百分比标签与圆心距离
  • linewidth: 条形图边框宽度
  • tick_label: 条形图的刻度标签
  • align: 指定x轴上对齐方式
# 每个年份的销售订单数量总和
data_b = df.groupby(df['创建日期'].dt.year).sum()['销售订单数量']
data_b.index = data_b.index.astype(int)
data_b_x = data_b.index
data_b_y = data_b.values
data_b_x
Int64Index([2013, 2014, 2015, 2016], dtype='int64', name='创建日期')
data_b_y = data_b_y.astype(int)
data_b_y
array([ 976024, 1760160, 2568675, 1182377])
plt.figure(figsize=(20,8),dpi=80)
plt.bar(x=data_b_x,
        height = data_b_y,
        width = 0.3,
        color = 'hotpink',
        #edge = 'gray',
        bottom = 1,
        linewidth = 0.2,
        tick_label = data_b_x,
        align = 'center'
       )
plt.title('柱状图-每个年份的销售订单数量总和',pad=30,fontsize=14)
plt.xlabel('年份')
plt.ylabel('订单数量')
plt.grid()
# 给条形图添加数据标注
for x, y in enumerate(data_b):
    plt.text(x + 2013, y, "%s" %y,fontsize=12)
plt.show()

在这里插入图片描述

3、直方图

对于连续型变量,往往需要查看其分布图,直方图就是用来观察数据的分布形态
plt.hist(x,bins,range,normed,cumulative,bottom,align,rwidth,color,edgecolor,label)

  • x: 数据
  • bins: 条形个数
  • range: 上下界
  • normed: 是否将频数转换成频率
  • cumulative: 是否计算累计频率
  • bottom: 为直方图的每个条形添加基准线,默认为0
  • align: 对齐方式
  • rwidth: 条形的宽度
  • color: 填充色
  • edgecolor: 设置直方图边框
df = pd.read_csv(r'E:\python\Python数据分析与挖掘从零开始到实战\数据分析篇\学习笔记\数据\air_data.csv')
df.head()
MEMBER_NOFFP_DATEFIRST_FLIGHT_DATEGENDERFFP_TIERWORK_CITYWORK_PROVINCEWORK_COUNTRYAGELOAD_TIME...ADD_Point_SUMEli_Add_Point_SumL1Y_ELi_Add_PointsPoints_SumL1Y_Points_SumRation_L1Y_Flight_CountRation_P1Y_Flight_CountRation_P1Y_BPSRation_L1Y_BPSPoint_NotFlight
0549932006/11/22008/12/246.北京CN31.02014/3/31...399921144521111006197603702110.5095240.4904760.4872210.51277750
1280652007/2/192007/8/36NaN北京CN42.02014/3/31...1200053288532884157682384100.5142860.4857140.4892890.51070833
2551062007/2/12007/8/306.北京CN40.02014/3/31...1549155202517114063612337980.5185190.4814810.4814670.51853026
3211892008/8/222008/8/235Los AngelesCAUS64.02014/3/31...034890348903722041861000.4347830.5652170.5517220.44827512
4395462009/4/102009/4/156贵阳贵州CN48.02014/3/31...2270464969649693388132103650.5328950.4671050.4690540.53094339

5 rows × 44 columns

plt.figure(figsize=(20,8),dpi=80)
plt.hist(df['AGE'],
         bins=60,
         # density=True, # 绘制概率密度形式
         # cumulative = False
         color = 'chocolate',
         edgecolor = 'black'
        )
plt.title('直方图',fontsize=14)
plt.grid()
plt.xlabel('客户年龄',fontsize=14)
plt.ylabel('频数',fontsize=14)
plt.show()

在这里插入图片描述

4、散点图

散点图一般用来展示2个连续型变量的的关系,可以通过散点图来判断两个变量之间是否存在某种关系,例如线性还是非线性关系

plt.scatter(x, y, s, c, marker, cmap, norm, alpha, linewidths, edgecolors)

  • x: x数据
  • y: y轴数据
  • s: 散点大小
  • c: 散点颜色
  • marker: 散点图形状
  • cmap: 指定某个colormap值,该参数一般不用,用默认值
  • alpha: 散点的透明度
  • linewidths: 散点边界线的宽度
  • edgecolors: 设置散点边界线的颜色
df.head()
MEMBER_NOFFP_DATEFIRST_FLIGHT_DATEGENDERFFP_TIERWORK_CITYWORK_PROVINCEWORK_COUNTRYAGELOAD_TIME...ADD_Point_SUMEli_Add_Point_SumL1Y_ELi_Add_PointsPoints_SumL1Y_Points_SumRation_L1Y_Flight_CountRation_P1Y_Flight_CountRation_P1Y_BPSRation_L1Y_BPSPoint_NotFlight
0549932006/11/22008/12/246.北京CN31.02014/3/31...399921144521111006197603702110.5095240.4904760.4872210.51277750
1280652007/2/192007/8/36NaN北京CN42.02014/3/31...1200053288532884157682384100.5142860.4857140.4892890.51070833
2551062007/2/12007/8/306.北京CN40.02014/3/31...1549155202517114063612337980.5185190.4814810.4814670.51853026
3211892008/8/222008/8/235Los AngelesCAUS64.02014/3/31...034890348903722041861000.4347830.5652170.5517220.44827512
4395462009/4/102009/4/156贵阳贵州CN48.02014/3/31...2270464969649693388132103650.5328950.4671050.4690540.53094339

5 rows × 44 columns

df['SEG_KM_SUM']
0        580717
1        293678
2        283712
3        281336
4        309928
          ...  
62983      1134
62984      8016
62985      2594
62986      3934
62987      4222
Name: SEG_KM_SUM, Length: 62988, dtype: int64
# 绘制飞行次数与总飞行公里数的关系
plt.figure(figsize=(20,8),dpi=80)
plt.scatter(x=df['FLIGHT_COUNT'],
            y=df['SEG_KM_SUM'],
            s=50,
            c='blue',
            marker='o',
            linewidths=1,
            edgecolors='tan'
           )
plt.title('飞行次数与总飞行公里数的关系',pad=10,fontsize=14)
plt.xlabel('飞行次数',fontsize=14,labelpad=10)
plt.ylabel('飞行公里数',fontsize=14,labelpad=10)
plt.show()

在这里插入图片描述

5、箱线图

箱线图是由一个箱体和一对箱须组成的统计图形。箱体是由第一四分位数,中位数和第三四分位数所组成的。在箱须的末端之外的数值可以理解成离群值,箱线图可以对一组数据范围大致进行直观的描述

plt.boxplot(x,notch,sym,vert,whis,positions,widths,patch_artist,meanline,showmeans, boxprops,labels,flierprops)

  • x: 数据
  • patch_artist: 是否填充箱体颜色
  • meanline:是否显示均值
  • showmeans: 是否显示均值
  • meanprops;设置均值属性,如点的大小,颜色等
  • medianprops:设置中位数的属性,如线的类型,大小等
  • showfliers: 是否表示有异常值
  • boxprops:设置箱体的属性,边框色和填充色
# 查看是否有缺失值
df['AGE'].isnull().any()
True
df['AGE'].isnull().sum()
420
# 删除年龄异常值
age = df[df['AGE'].notnull()]['AGE'] 
# 航空公司客户年龄分布箱线图
plt.figure(figsize=(20,8),dpi=80)
plt.boxplot(age,
            patch_artist=True,
            meanline=True,
            showmeans=True,
            flierprops={'marker':'o','markerfacecolor':'red','markersize':5},
            meanprops = {'marker':'o','markerfacecolor':'yellow','markersize':6},
            medianprops = {'linestyle':'--','color':'orange'},
            showfliers=True,
            boxprops = {'color':'red','facecolor':'steelblue'}
           )
plt.title('航空公司客户年龄分布箱线图',fontsize=14,pad=20)
plt.show()

在这里插入图片描述

完善图形设置

df = pd.read_csv(r'E:\python\Python数据分析与挖掘从零开始到实战\数据分析篇\学习笔记\数据\air_data.csv')
df.head()
MEMBER_NOFFP_DATEFIRST_FLIGHT_DATEGENDERFFP_TIERWORK_CITYWORK_PROVINCEWORK_COUNTRYAGELOAD_TIME...ADD_Point_SUMEli_Add_Point_SumL1Y_ELi_Add_PointsPoints_SumL1Y_Points_SumRation_L1Y_Flight_CountRation_P1Y_Flight_CountRation_P1Y_BPSRation_L1Y_BPSPoint_NotFlight
0549932006/11/22008/12/246.北京CN31.02014/3/31...399921144521111006197603702110.5095240.4904760.4872210.51277750
1280652007/2/192007/8/36NaN北京CN42.02014/3/31...1200053288532884157682384100.5142860.4857140.4892890.51070833
2551062007/2/12007/8/306.北京CN40.02014/3/31...1549155202517114063612337980.5185190.4814810.4814670.51853026
3211892008/8/222008/8/235Los AngelesCAUS64.02014/3/31...034890348903722041861000.4347830.5652170.5517220.44827512
4395462009/4/102009/4/156贵阳贵州CN48.02014/3/31...2270464969649693388132103650.5328950.4671050.4690540.53094339

5 rows × 44 columns

WORK_PROVINCE = df['WORK_PROVINCE'].value_counts()[:10]

legend(loc,bbox_to_anchor,ncol,title,shadow,fancybox)

  • loc: 位置(可以使用数字)
  • bbox_to_anchor: 该参数是一个4元元组,第一个元素代表距离画布左侧的y轴长度的倍数的距离,第二个元素代表距离画布底部X轴长度的倍数,第三个元素和第四个代表框的长度和和宽度
  • frameon: 是否要边框
  • ncol: 图例的排列个数
  • title: 标题
  • shadow: shadow线框是否添加阴影
  • fancybox: 线框的圆角还是直角
fig = plt.figure(figsize=(20,8),dpi=80)
ax =fig.add_axes([0.2,0.4,0.8,0.7])# 画布大小
plt.plot(WORK_PROVINCE,color='g',marker='o',ls='--',label='注册用户数')
plt.xlabel('地区',fontsize=14,labelpad=10)
plt.ylabel('注册用户数',fontsize=14,labelpad=10)
plt.xticks(WORK_PROVINCE.index,fontsize=12,rotation=45)
plt.yticks(fontsize=12)
plt.title('航空公司注册用户折线图',fontsize=14,pad=10)
plt.legend(bbox_to_anchor=(1,1),loc='best',title='航空公司',frameon=True,shadow=True,fancybox=False,ncol=1)
plt.annotate('注册用户最多省份',xy=(0,17500), xytext=(2,15000),weight='bold',color='black',
             arrowprops =dict(arrowstyle='->',connectionstyle = 'arc3',color='red')) 
plt.show()

在这里插入图片描述

调整刻度值

# 统计不同年份计算注册会员数
data_vip = df.groupby(df['FFP_DATE']).size()

data_vip.index
Index(['2004/11/1', '2004/11/10', '2004/11/11', '2004/11/12', '2004/11/13',
       '2004/11/14', '2004/11/15', '2004/11/16', '2004/11/17', '2004/11/18',
       ...
       '2013/3/29', '2013/3/3', '2013/3/30', '2013/3/31', '2013/3/4',
       '2013/3/5', '2013/3/6', '2013/3/7', '2013/3/8', '2013/3/9'],
      dtype='object', name='FFP_DATE', length=3068)
import matplotlib as mpl
plt.figure(figsize=(20,8),dpi=80)
# 获取图的坐标信息
ax = plt.gca()
# 设置日期的显示格式
date_format = mpl.dates.DateFormatter("%Y-%m-%d")
ax.xaxis.set_major_formatter(date_format)
# 设置x轴显示多少个日期刻度
xlocator = mpl.ticker.LinearLocator(20)
# 设置x轴每个刻度的间隔天数
#xlocator = mpl.ticker.MultipleLocator(100)
ax.xaxis.set_major_locator(xlocator)
# 为了避免x轴刻度标签的紧凑,将刻度标签旋转45度
plt.plot(data_vip.index,
         data_vip.values,
         linestyle = '-', # 折线类型
         linewidth = 2, # 折线宽度
         color = 'steelblue') # 折线颜色
plt.xticks(rotation=45)
# 添加y轴标签
plt.ylabel('会员数量')
# 添加图形标题
plt.title('不同年份会员数量变化趋势')
# 显示图形
plt.show()

在这里插入图片描述

处理日期值

df['FFP_DATE'] = pd.to_datetime(df['FFP_DATE'],format='%Y/%m/%d',errors='coerce')
df['FFP_DATE']
0       2006-11-02
1       2007-02-19
2       2007-02-01
3       2008-08-22
4       2009-04-10
           ...    
62983   2011-05-20
62984   2010-03-08
62985   2006-03-30
62986   2013-02-06
62987   2013-02-17
Name: FFP_DATE, Length: 62988, dtype: datetime64[ns]
df.columns
Index(['MEMBER_NO', 'FFP_DATE', 'FIRST_FLIGHT_DATE', 'GENDER', 'FFP_TIER',
       'WORK_CITY', 'WORK_PROVINCE', 'WORK_COUNTRY', 'AGE', 'LOAD_TIME',
       'FLIGHT_COUNT', 'BP_SUM', 'EP_SUM_YR_1', 'EP_SUM_YR_2', 'SUM_YR_1',
       'SUM_YR_2', 'SEG_KM_SUM', 'WEIGHTED_SEG_KM', 'LAST_FLIGHT_DATE',
       'AVG_FLIGHT_COUNT', 'AVG_BP_SUM', 'BEGIN_TO_FIRST', 'LAST_TO_END',
       'AVG_INTERVAL', 'MAX_INTERVAL', 'ADD_POINTS_SUM_YR_1',
       'ADD_POINTS_SUM_YR_2', 'EXCHANGE_COUNT', 'avg_discount',
       'P1Y_Flight_Count', 'L1Y_Flight_Count', 'P1Y_BP_SUM', 'L1Y_BP_SUM',
       'EP_SUM', 'ADD_Point_SUM', 'Eli_Add_Point_Sum', 'L1Y_ELi_Add_Points',
       'Points_Sum', 'L1Y_Points_Sum', 'Ration_L1Y_Flight_Count',
       'Ration_P1Y_Flight_Count', 'Ration_P1Y_BPS', 'Ration_L1Y_BPS',
       'Point_NotFlight'],
      dtype='object')
# 统计不同年份的飞行次数总数和飞行公里数总和
data_sum = df.groupby(df['FFP_DATE'].dt.year)[['FLIGHT_COUNT','SEG_KM_SUM']].sum()
data_sum
FLIGHT_COUNTSEG_KM_SUM
FFP_DATE
2004849213046594
20055458476263647
200674116107466218
200781398115824690
200880384115958959
200973515102908088
201092398133804987
2011117870170898377
2012135812200675940
20132717241751371

绘制双坐标轴

fig = plt.figure(figsize=(20,8),dpi=80) 
ax1 = fig.add_subplot(111)
ax1.plot(data_sum.index, data_sum['FLIGHT_COUNT'],label='飞行次数')
ax1.set_ylabel('飞行次数')
ax1.set_title("飞行次数,飞行里程数与年份关系")
plt.legend(loc ='upper left')
ax2 = ax1.twinx()  #添加次坐标轴
ax2.plot(data_sum.index, data_sum['SEG_KM_SUM'], 'r',label='飞行里程数')
ax2.set_ylabel('飞行里程数')
plt.legend(loc ='upper right')
plt.show()

在这里插入图片描述

绘制子图

# 设置绘图区域
plt.figure(figsize=(20,8),dpi=80)
plt.subplot(121) # 位置
plt.bar(x = range(0,len(data_b)),height = data_b,align='center',color='y',tick_label= data_b.index)
plt.xlabel('年份',labelpad = 19)  # 控制标签和坐标轴的距离
plt.ylabel('订单数量总和',labelpad =10)
plt.title('不同年份的订单数量总和',pad=15)
plt.subplot(122)
#绘制直方图
plt.hist(x =df['AGE'],bins=30,color='r',edgecolor='black',density=True)# density=True代表是否绘制概率密度形式
plt.xlabel('客户年龄',fontsize =15,labelpad =20)
plt.ylabel('频数',fontsize =15,labelpad =20)
plt.title('年龄分布图',fontsize =15,pad =20)
plt.show()

在这里插入图片描述

subplot2grid应用

  • subplot2grid函数可以让子区跨越固定的网格布局的多个行和列,实现不同的子区布局
  • plt.subplot2grid(shape,loc,colspan,rowspan) 参数
  • shape: 网格布局
  • loc: 表示图形的位置起点
  • colspan: 跨越的列数
  • rowspan : 跨越的行数
#设置绘图区域
plt.figure(figsize=(16,9))
plt.subplot2grid((2,3),(0,0),colspan = 1,rowspan=2) #设置绘图区域
plt.bar(x = range(0,len(data_b)),height = data_b,align='center',color='y',tick_label= data_b.index)
plt.xlabel('年份',labelpad = 19)  # 控制标签和坐标轴的距离
plt.ylabel('订单数量总和',labelpad =10)
plt.title('不同年份的订单数量总和',pad=15)

plt.subplot2grid((2,3),(0,1),colspan =2,rowspan=1 ) #设置绘图区域
plt.hist(x =df['AGE'],bins=30,color='r',edgecolor='black',density=True)# density=True代表是否绘制概率密度形式
plt.xlabel('客户年龄',fontsize =15,labelpad =20)
plt.ylabel('频数',fontsize =15,labelpad =20)
plt.title('年龄分布图',fontsize =15,pad =20)

plt.subplot2grid((2,3),(1,1),colspan=2,rowspan=1) #设置绘图区域
plt.scatter(x = df['FLIGHT_COUNT'],y=df['SEG_KM_SUM'],color= 'steelblue',marker='o', s=100)
plt.xlabel('飞行次数',fontsize=12) # 坐标轴标签大小
plt.ylabel('飞行总公里数',fontsize=12)
plt.title('飞行次数与总飞行公里数的关系')
# 显示
plt.tight_layout()# 调整每个子图之间的距离
plt.show()

在这里插入图片描述


  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-10-23 12:25:47  更:2021-10-23 12:29:04 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/29 11:44:53-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计