Task01 本次学习参照Datawhale开源学习:https://github.com/datawhalechina/fantastic-matplotlib 内容大体源自原文,结合自己学习思路有所调整。 个人总结:一、matplotlib是python数据可视化最重要且常见的工具之一,理解matplotlib的设计框架有助于提高绘图效率。二、一个完整的matplotlib图像由下至上通常会包括以四个层级:Figure、Axes、Axis、Tick。三、matplotlib提供了两种最常用的绘图接口:1.创建figure和axes,在上面调用绘图方法和 2.依赖pyplot自动创建figure和axes并绘图。方式一表达明确,但代码量比较多;方式二表达简洁,但子图较多时容易造成混乱。
1. Matplotlib初识
1.1. 为什么学习matplotlib
学习matplotlib初衷:做特征工程时常常需要数据可视化来引导,同时做机器学习时也常常需要可视化来观察结果。而matplotlib是python数据可视化最重要且常见的工具之一,很多其它绘图包都是基于此来封装的。往往我们绘图时现用现查,用过即忘,效率极低。并且没有深入理解matplotlib的设计框架,往往是只会复制粘贴,面对复杂图表时一筹莫展。因此本课程将系统学习matplotlib,理解绘图原理、提高绘图效率。
1.2. 什么是matplotlib
Matplotlib是一个Python 2D绘图库,能够以多种硬拷贝格式和跨平台的交互式环境生成出版物质量的图形,用来绘制各种静态,动态,交互式的图表。Matplotlib已经成为python中公认应用最广的数据可视化工具,我们所熟知的seaborn等绘图接口其实也是基于matplotlib所作的封装。
1.3. 一个简单的例子
Matplotlib的图像是画在figure(相当于画板)上的,每一个figure又包含了一个或多个axes(相当于画纸)。最简单的创建figure以及axes的方式是通过pyplot.subplots 命令,创建axes以后,可以使用Axes.plot 绘制最简易的折线图。
import matplotlib.pyplot as plt
import numpy as np
fig, ax = plt.subplots()
ax.plot([1, 2, 3, 4], [1, 4, 2, 3])
我们还可以通过一种更简单的方式绘制图像,matplotlib.pyplot方法能够直接在当前axes上绘制图像,如果用户未指定axes,matplotlib会帮你自动创建一个。
plt.plot([1, 2, 3, 4], [1, 4, 2, 3])
1.4. Figure的组成
一个完整的matplotlib图像通常会包括以下四个层级(也称 容器container):
Figure :最底层。相当于画板。Axes :Figure的上层,子图。相当于画纸。需要与subplot进行区分。subplot也是子图,但子图间不可重叠;而Axes子图间可重叠。Axis :Axes的上层,坐标轴。用于处理所有和坐标轴,网格有关的元素。Tick :Axis的上层,刻度。用来处理所有和刻度有关的元素。
1.5. 两种绘图接口
如1.3例子中,matplotlib提供了两种最常用的绘图接口。
- 显式创建figure和axes,在上面调用绘图方法,也被称为OO模式(object-oriented style)
- 依赖pyplot自动创建figure和axes,并绘图
使用第一种绘图接口,是这样的:
x = np.linspace(0, 2, 100)
fig, ax = plt.subplots()
ax.plot(x, x, label='linear')
ax.plot(x, x**2, label='quadratic')
ax.plot(x, x**3, label='cubic')
ax.set_xlabel('x label')
ax.set_ylabel('y label')
ax.set_title("Simple Plot")
ax.legend()
而如果采用第二种绘图接口,绘制同样的图,代码是这样的:
x = np.linspace(0, 2, 100)
plt.plot(x, x, label='linear')
plt.plot(x, x**2, label='quadratic')
plt.plot(x, x**3, label='cubic')
plt.xlabel('x label')
plt.ylabel('y label')
plt.title("Simple Plot")
plt.legend()
使用方式一的ax.plot()表达明确,但代码量比较多略显繁琐;使用方式二的plt.plot()表达简洁,但子图较多时容易造成混乱。 可以根据实际情况使用不同画图方式。
|