提示:
1.series
Series是一个类似于一维数组的数据结构,它能够保存任何类型的数据,比如整数、字符串、浮点数等,主要由一组数据和与之相关的索引两部分构成。
# 导入pandas
import pandas as pd
pd.Series(data=None, index=None, dtype=None)
- 指定内容,默认索引
pd.Series(np.arange(10)) - 指定索引
pd.Series([6.7,5.6,3,10,2], index=[1,2,3,4,5]) - 通过字典数据创建
color_count = pd.Series({'red':100, 'blue':200, 'green': 500, 'yellow':1000})
Series的属性
index
color_count.index
# 结果
Index(['blue', 'green', 'red', 'yellow'], dtype='object')
values
color_count.values
# 结果
array([ 200, 500, 100, 1000], dtype=int64)
也可以使用索引来获取数据:
color_count[2]
# 结果
100
2.DataFrame
DataFrame是一个类似于二维数组或表格(如excel)的对象,既有行索引,又有列索引
# 导入pandas
import pandas as pd
pd.DataFrame(data=None, index=None, columns=None)
# 生成10名同学,5门功课的数据
score = np.random.randint(40, 100, (10, 5))
# 使用Pandas中的数据结构
score_df = pd.DataFrame(score)
# 构造行索引序列
subjects = ["语文", "数学", "英语", "政治", "体育"]
# 构造列索引序列
stu = ['同学' + str(i) for i in range(score_df.shape[0])]
# 添加行索引
data = pd.DataFrame(score, columns=subjects, index=stu)
DataFrame的属性
- shape
- index
- columns
- values
- T
- head(5)
- tail(5)
|