Python之pandas
环境:jupyter Notebook(Anaconda)
1.引入pandas库和numpy库
import pandas as pd
import numpy as np
2. 读取文件
t1=pd.read_excel('D:\scores.xlsx',header=[0,1],index_col=0)
t1
data:image/s3,"s3://crabby-images/0d64c/0d64c6a41442df1f2573d7e81b2bdb0bbfa2d301" alt="在这里插入图片描述"
3. index函数
index 接收boolean。表示是否将行索引作为数据传入数据库。默认为True index_label 接收string或者sequence.代表是否引用索引名称,如果index参数为true,此参数为None,则使用默认名称。如果为多重索引,则必须使用sequence形式。默认为None
sorted_obj=t1.sort_index(ascending=True)
sorted_obj
data:image/s3,"s3://crabby-images/4ef27/4ef273dc6c3b437708b49cbef20f87e11f89d43d" alt="在这里插入图片描述"
4.max与min函数
sorted_obj.max()
sorted_obj.min()
tt=sorted_obj['一本分数线','文科'].max()-sorted_obj['一本分数线','文科'].min()
tt
data:image/s3,"s3://crabby-images/4e647/4e64704a0137613dc84d2b6c315160dfea277c4f" alt="在这里插入图片描述" data:image/s3,"s3://crabby-images/9cf43/9cf437589767f092b81c86c2f55a352afecbde47" alt="在这里插入图片描述"
5. ptp函数
np.ptp()函数实现的功能等同于np.max(array) - np.min(array) 调用ptp()函数计算极差。
result1=np.array(sorted_obj['一本分数线','文科']).ptp()
result1
result2=np.array(sorted_obj['一本分数线','理科']).ptp()
result2
result3=np.array(sorted_obj['二本分数线','文科']).ptp()
result3
result4=np.array(sorted_obj['二本分数线','理科']).ptp()
result4
data:image/s3,"s3://crabby-images/83ee0/83ee05995b39d5fc0ac858b756bc8d7082fe523e" alt="在这里插入图片描述"
6. sorted函数
比较2018年一本与二本文理科分数线的差值
ser_obj1=sorted_obj['一本分数线','文科']
ser_obj1[2018]-ser_obj1[2017]
ser_obj1=sorted_obj['一本分数线','理科']
ser_obj1[2018]-ser_obj1[2017]
ser_obj1=sorted_obj['二本分数线','理科']
ser_obj1[2018]-ser_obj1[2017]
ser_obj1=sorted_obj['二本分数线','文科']
ser_obj1[2018]-ser_obj1[2017]
data:image/s3,"s3://crabby-images/5deac/5deacf54282b08893bae4c49d644b2ba8c5925e9" alt="在这里插入图片描述"
7. describe函数
mean()函数或describe()函数都可以计算出每列的平均数,通过调用describe()方法来查看多个统计指标
计算2006-2018年的平均分数线
sorted_obj.describe()
data:image/s3,"s3://crabby-images/517b8/517b857250a4c84a03312b8b8cc38d20940b3a1a" alt="在这里插入图片描述"
data:image/s3,"s3://crabby-images/179a1/179a16f7f59283c5606a249296c108a31ca6b913" alt="在这里插入图片描述" 码字不易,觉得内容有帮助的请一键三联哟~ 这样我也才有动力和你一起学习
|