- pandas经常和其它?具?同使?,如数值计算?具NumPy和SciPy,分析库statsmodels和scikit-learn,和数据可视化库matplotlib。
- pandas是基于NumPy数组构建的,特别是基于数组的函数和不使?for循环的数据处理。
- 虽然pandas采?了?量的NumPy编码?格,但?者最?的不同是pandas是专?为处理表格和混杂数据设计的。?NumPy更适合处理统?的数值数组数据。
- 要使?pandas,你?先就得熟悉它的两个主要数据结构:Series和DataFrame。
- Series:?种类似于?维数组的对象,它由?组数据(各种NumPy数据类型)以及?组与之相关的数据标签(即索引)组成。
import pandas as pd
import numpy as np
obj = pd.Series([4, 7, -5, 3])
print(obj)
print(obj.values)
print(obj.index)
import pandas as pd
import numpy as np
obj2 = pd.Series([4, 7, -5, 3], index=['d', 'b', 'a','w'])
print(obj2)
print(obj2['a'])
print(obj2[['c', 'a', 'd']])
print(obj2[obj2 > 0])
print(obj2 * 2)
print(np.exp(obj2))
print('b' in obj2)
print('e' in obj2)
obj2['d'] = 6
print(obj2)
import pandas as pd
import numpy as np
sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000}
obj3 = pd.Series(sdata)
print(obj3)
print(pd.isnull(obj3))
print(pd.notnull(obj3))
print(obj3.isnull())
|