pandas - 学习总结1
产品文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html
import pandas as pd
"""
import pandas as pd
# 产品文档 https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html
# 读取所有sheet页的数据,键是sheet名,值是每个sheet页的数据
sheet_name = list(pd.read_excel("./downloaded_files/下载的表格_2022-01-29.xlsx", sheet_name=None).keys())
print(sheet_name) # 读取所有sheet用名
# 读取第一页的数据
表格数据 = pd.read_excel("./downloaded_files/远程连接列表_2022-01-29.xlsx", sheet_name=0)
表格数据.to_excel("./downloaded_files/demo001.xlsx", sheet_name="passengers", index=False) # 将数据替换到demo表格中
print(表格数据) # 读取第一页所有数据
print(表格数据.keys()) # 读取第一页数据的所有列名
print(表格数据.index) # 读取
print(表格数据.values[0]) # 读取第一页数据的第一行数据内容
print(表格数据.head(1)) # 读取表前几行
print(表格数据.tail(2)) # 读取表后几行
print(表格数据.dtypes) # 读取表格中每个列属性
print(表格数据.info)
print(表格数据["订单号"].head(3)) # 读取sheet页某个字段的前3个数据
print(表格数据["订单号"].tail(1)) # 读取sheet页某个字段的最后1个数据
print(表格数据["订单号"].shape) # 读取sheet页的数据行个数
print(表格数据[["订单号", "云服务器"]].head()) # 读取多个字段的内容
print(表格数据[["订单号", "云服务器"]].shape) # 读取sheet页的数据行个数
print(表格数据[表格数据["Age"] > 35].shape) # 过滤出 age>25 的行数据个数
print(表格数据[表格数据["Pclass"].isin([2, 3])]) # 过滤出 pclass = 2和3 的所有数据
print(表格数据[表格数据["Age"].notna()]) # 过滤出 age != None 的数据
print(表格数据.loc[表格数据["age"] > 35, "Name"]) # 过滤出 年龄大于35 的 人名字
print(表格数据.iloc[9:25, 2:5]) # 过滤出中间行的数据
"""
表格数据 = pd.read_excel("./downloaded_files/远程连接列表_2022-01-29.xlsx", sheet_name=0)
print(表格数据.values[2][0])
|