Python绘制直方图注意事项总结:
1.Python绘制直方图注意事项
1.1问题:分组数据频数统计出现错误,如下图1.1所示。
同一组数据,按大小分成两组数据,在分组间隔不改变的情况下,频数统计与之前不一样。 说明plt.hist()函数绘图有问题-在[0,1]是正确的,非[0,1]区间不能绘制直方图。
1.2原因:plt.hist中的rectangle函数分箱不是理想中的0.01,所以频数统计有问题,如图1.2系列所示。
三组采样集合箱宽不同,造成频数统计不和谐。
?????????????
~~~~~~~~~~~~~
?????????????samples:bins_width=0.01
?????????????
~~~~~~~~~~~~~
?????????????samples_:bins_width=0.007
?????????????
~~~~~~~~~~~~~
?????????????samples__:bins_width=0.008
1.3解决方法:如果要绘制非[0,1]区间数据集的直方图
????
~~~~
???? 1.3.1使用python别的函数——plt.bar(x,height)绘制
????
~~~~
???? 1.3.2将数据打印复制或书写到其他软件并绘制——excle…
????
~~~~
???? 1.3.3整合到[0,1]区间再绘制
????
~~~~
???? 1.3.4更改plt.hist()函数
????
~~~~
???? 1.3.1 使用samples、samples_、samples__三个原始采样集合结合plt.bar(x,height)函数绘制直方图。(但因部分代码涉及技术问题,暂不全公开, 仅公开一部分通用代码) 效果如下图所示,说明该方法可行:
????????
~~~~~~~~
???????? 1.3.1 图片如下:
????????
~~~~~~~~
???????? 1.3.2代码如下:
plt.figure(figsize=(8,4))
plt.title('自绘分区间采样结果的频数统计直方图')
plt.bar(myxl,mynl,color='orange',width=0.01,label='my.hist samples_0_1')
plt.bar(myxl_,mynl_,color='yellow',width=0.01,label='my.hist samples_0_0.4')
plt.bar(myxl__,mynl__,color='yellow',width=0.01,label='my.hist samples_0.4_1')
plt.legend(loc='upper left')
plt.show()
1.2图片如下: 1.2代码如下:(如果阅者碰到类似频数统计解决不理想的问题,可以通过下述方式查看)
xl,nl,batches=plt.hist(samples,bins=100,color='orange',label='samples_[0-1]')
xl_,nl_,batches_=plt.hist(samples_,bins=40,color='yellow',label='samples_[0-0.4]')
xl__,nl__,batches__=plt.hist(samples__,bins=60,color='yellow',label='samples_[0.4-1]')
for i in batches:
print(i)
print("\n")
for i in batches_:
print(i)
print("\n")
for i in batches__:
print(i)
print("\n")
1.1图片如下:
1.1代码如下(但因部分代码涉及技术问题,暂不公开) 仅公开一部分通用代码如下:
samples
ssamples_=[]
ssamples__=[]
for i in samples:
if i<=0.4:
ssamples_.append(i)
else:
ssamples__.append(i)
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.figure(figsize=(8,4))
plt.title('采样频数统计直方图')
nl,binsxl,batches=plt.hist(samples,bins=100,color='blue',label='samples_[0-1]')
nl_,binsxl_,batches_=plt.hist(samples_,bins=40,color='aqua',label='samples_[0-0.4]')
nl__,binsxl__,batches__=plt.hist(samples__,bins=60,color='aqua',label='samples_[0.4-1]')
plt.legend()
plt.axis("on")
plt.show()
参考文章: 1.python–plt.hist函数的输入参数和返回值的解释 2.Python直方图美化:多颜色二维直方图(内附色卡)
|