1.读取数据
NBA数据链接: nba.csv. 读取数据代码:
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv(r'nba.csv', encoding = 'big5')
data = data.iloc[:, :].fillna(value=0)
print(data)
读取结果如下所示:  其中:
data = data.iloc[:, :].fillna(value=0)
表示的是获取表格中的所有数据,并处理空白的表格,将其值赋为0。而如果只想读取从第三列之后的数据,则可以使用下面的代码:
data = data.iloc[:, 3:].fillna(value=0)
测试结果如下: 
2.处理薪水数据
为了方便处理,加上一下代码:
raw_data = data.to_numpy()
print(raw_data)
测试结果如下:  由此判断该代码是用来将表格数据处理为列表数据,随后为了处理NBA列表中的薪水问题,完整代码如下:
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv(r'nba.csv', encoding = 'big5')
data = data.iloc[:, :].fillna(value=0)
raw_data = data.to_numpy()
message = {}
temp = raw_data[0][1]
sum = raw_data[0][8]
for i in range(1, len(raw_data)):
if temp == raw_data[i][1]:
sum += raw_data[i][8]
else:
message[temp] = sum
temp = raw_data[i][1]
sum = 0
x1 = list(message.keys())
x2 = list(message.values())
fig = plt.figure()
plt.plot(x1[1:11], x2[1:11], label='NBA Salary')
plt.legend()
fig.tight_layout(h_pad=3)
plt.show()
其中:
x1 = list(message.keys())
x2 = list(message.values())
是为了将字典格式的keys形式转换为列表形式,以方便绘图 运行结果如下:  这里只显示前10个队的薪水折线图,如果要多个子图显示所有队伍的总薪水折线图,则代码如下:
fig, ax = plt.subplots(3, 2)
ax[0][0].plot(x1[1:6], x2[1:6], label='NBA Salary', color='red')
ax[0][1].plot(x1[6:11], x2[6:11], label='NBA Salary', color='#D2691E')
ax[1][0].plot(x1[11:16], x2[11:16], label='NBA Salary', color='#00CED1')
ax[1][1].plot(x1[16:21], x2[16:21], label='NBA Salary')
ax[2][0].plot(x1[21:26], x2[21:26], label='NBA Salary', color='#8A2BE2')
ax[2][1].plot(x1[26:31], x2[26:31], label='NBA Salary', color='green')
plt.legend()
fig.tight_layout(h_pad=1)
fig.tight_layout(w_pad=0.1)
plt.show()
得出的结果如下所示:  如果想显示柱状图和散点图,则代码如下:
ax[0][0].scatter(x1[1:6], x2[1:6], label='NBA Salary', color='red')
ax[0][1].scatter(x1[6:11], x2[6:11], label='NBA Salary', color='#D2691E')
ax[1][0].plot(x1[11:16], x2[11:16], label='NBA Salary', color='#00CED1')
ax[1][1].plot(x1[16:21], x2[16:21], label='NBA Salary')
ax[2][0].bar(x1[21:26], x2[21:26], label='NBA Salary', color='#8A2BE2')
ax[2][1].bar(x1[26:31], x2[26:31], label='NBA Salary', color='green')
结果如下所示:  最好展示一下所有数据的柱状图,颜色可以从RGB表中选择合适的进行设置,一般就按正常颜色即可:  找到薪水最大的值以及对应的球队:
for key, value in message.items():
if value == max(message.values()):
print(key, value)
结果如下,2016年薪水最高的球队是克利夫兰骑士,值得一提的是当年拿到了总冠军: 
3.处理身高与体重之间的关系
|