一、基本数据结构
1.1 列表
数据结构之列表
包括列表的排序、zip 函数、交集、并集等。
1.2 元组
数据结构之元组
包括元组的创建和常用方法(count 方法)
1.3 字典
数据结构之字典
包括字典的创建和操作(访问、插入、替换、检查、删除等)
1.4 集合
数据结构之集合
包括集合的创建和操作
二、pandas库
2.1 Series和DataFrame
pandas之数据结构介绍
包括Series 和DataFrame 的创建方法
2.2 查找数据
pandas之查找数据
包括使用loc 和iloc 方法来查找dataframe中的数据
2.3 汇总和计算描述统计
pandas之汇总和计算描述统计
包括求和、方差、平均值、相关系数、协方差矩阵、去重、值计数等
2.4 常用属性、方法和函数
pandas之常用属性、方法和函数
包括sort_index 、sort_values 、rank 、merge 、concat 、reset_index() 、rename() 、reindex() 等
2.5 groupby函数
pandas之groupby函数
包括groupby 函数的各个参数、agg() 、apply() 和transform()
2.6 对连续数据进行分箱
pandas之分箱操作
包括用cut 函数和qcut 函数实现等宽法和等频法
2.7 缺失值的处理
数据清洗之处理缺失值
包括缺失值的表示、删除和填充
2.8 数据转换
数据处理之数据转换
包括对重复值的删除、替换等
2.9 stack和unstack
pandas之stack和unstack
包括stack 和unstack 的用法
2.10 处理时间序列数据
pandas之处理时间序列数据
包括字符串与datetime的相互转换、datetime作为索引时的一些方法等
2.11 可视化
可视化之基础设置
可视化之用pandas绘制简单的图形
三、numpy库
3.1 生成随机数
numpy之生成随机数
包括生成均匀分布、正态分布、指数分布、二项分布、bootstrap抽样等
3.2 数据探索性分析
numpy之数据探索性分析
检验几组数据的方差是否相等
包括计算分位数、方差、SW检验、KS检验、t检验、检验方差齐性等
3.3 拼接数据
numpy之用concatenate()拼接数据
3.4 多维数组
numpy之多维数组
包括数组的建立、索引(含布尔索引)和切片
3.5 通用函数
numpy之通用函数
包括计算平方根、乘、除等操作
3.6 向量化函数
添加链接描述
包括 where 函数、布尔数组、排序函数等
3.7 矩阵操作
numpy之矩阵操作
包含矩阵的点乘、特征值、特征向量等
四、其它
4.1 lambda函数
lambda函数
4.2 错误和异常处理
错误和异常处理
4.3 数据清洗之字符串操作和正则表达式
数据清洗之字符串操作和正则表达式
|