IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【数据挖掘】pandas使用手册 -> 正文阅读

[人工智能]【数据挖掘】pandas使用手册

前言

? ? ? ? 等到了我们学校的数据挖掘课程,就从最简单的pandas开始记录我的数据挖掘学习历程吧!希望这份手册能在之后需要的时候帮助到大家。


pandas使用手册

第一部分:series基础

操作参考:

创建series

取一个元素

取多个元素

赋值

Series间的计算

Series函数的使用

使用apply

练习题:

第二部分:dataframe基础?

操作参考:

创建DataFrame

查看DataFrame信息

取一个列成一个series

取多个列成一个DataFrame

条件读取

取出一行成为series

赋值

groupby操作

使用apply

生成一列series数据的便捷方法:?

练习题:

第三部分:dataframe绘图

操作参考:

条件删除行

直方图

散点图?

箱型图


series基础

操作参考:

创建series

>>> ser2 = Series(range(4),index = ["a","b","c","d"])

取一个元素

>>> ser2["a"]
>>> ser2[1]

取多个元素

>>>?ser2[1:3]
>>>?ser2[['a', 'c']]

赋值

>>>?ser2["a"] = 7 ?????#赋一个值
>>>?ser2[1:3] = 10 ????#批量赋值
>>>?ser2[['a', 'c']] = [9, 8]

Series间的计算

>>>?print(a + b)???
>>>?print(a * 2)
>>>?print(a >= 3) ??#产生true false的新series
>>>?print(a[a >= 3]) ?#取出true false series的对应的值成series,相当于where条件

Series函数的使用

>>> print(a.mean()) #均值
>>> print(a.sum()) #求和

使用apply

>>>?print(a.apply(lambda x:x**2))??#全部平方

练习题:

  1. 创建一个6个元素的Series, 值是[4,5,6,7,8,9], index是 ‘a’到 ‘f’
  2. 两种方法取ser的第二个元素
  3. 求ser的平均值和中位数
  4. 找到ser中所有偶数:包含判断以及取数两部分
  5. 将ser中所有偶数,改成10,12,14
  6. 将ser中所有偶数,改成2
  7. 将ser中所有偶数,翻倍
  8. 将ser应用自定义函数,当数字是奇数,翻倍;当数字是偶数,除以2

dataframe基础?

操作参考:

创建DataFrame

>>> df = pd.DataFrame([[1,2,3], [6,7,8]],columns= ["a","b","c"])
>>> df = pd.DataFrame({'country':['aaa','bbb','ccc'], 'population':[10,12,14]})
>>> df = pd.read_csv("yours.csv")

查看DataFrame信息

>>>df.info()
>>>df.index
>>>df.columns
>>>df.dtypes
>>>df.values

取一个列成一个series

>>>?df["a"]
>>> df.loc[:, 'a']

取多个列成一个DataFrame

>>>?df[["a","c"]]
>>> df.loc[[1,2], ['a']] ?#只取两行a列

条件读取

>>> df[df['a'] > 3]
>>> df[(df['a'] > 3)?& (df['b']< 8)]

取出一行成为series

>>> df.iloc[0]

赋值

>>>df['a'] = [1,2,3] ?#注意行数一致 ?
>>>df[['a', 'c']] = 8 ??#若要取指定行,需要用loc或iloc
>>>df.loc[:, 'd'] = df.loc[:, 'b'] ???#将b列赋值到新的d列
>>>df.loc[df['b'] < 3, 'c'] = ?df.loc[df['b'] < 3,'d']
?#将b<3 的d列赋值到c列 注意两边的条件要一样,才能满足索引一致的要求,否则赋值越界

groupby操作

>>> df = pd.DataFrame({'key':['A','B','C','A','B','C','A','B','C'],'data':[0,5,10,5,10,15,10,15,20]})
>>>?df.groupby('key').sum() ?#按key成组,每组所有列求和
>>>?df.groupby('key')['data'].mean() ??#按key成组,每组求均值,取data列的聚合结果series
>>>?for key, gdata in df.groupby('Sex'):?????#gdata是一个DataFrame
>>>print(key, gdata.values) ??

使用apply

>>>def my_min(a, b): ??#先定义函数
????????????return min(abs(a),abs(b))
>>>df1['k'] = df.apply(lambda row: my_min(row['val_1'], row['val_2']), axis=1) ???#使用匿名函数传每行的特定列, 返回一个series 再赋值到k列,注意axis=1、

生成一列series数据的便捷方法:?

>>> df['val_1'] = df['value'].diff(k) ????#同列逐行向上/下相减
>>> df['val_2'] = df[''value'].shift(k) ??#所有行向上/下移动k位

练习题:

  1. 读取天气的数据文件weather.csv
  2. 用apply实现一列rain = rain08+rain20;若一边存在999990,则返回999990
  3. 按station补前一天日期: 按station分组,每组内部,使用shift方法将前一天的数据移动到今天
  4. 按城市补全rain08: 按city分组,将同一天内rain08中999990的值,替换成同城所有station的rain08的非999990的 均值,如果都缺失则补0;

dataframe绘图

操作参考:

条件删除行

df = df.drop(?df[?( df['value'] < 50) & ( df['value'] > 20)].index)

其中drop传入的是 df条件取出的的index

直方图

df['temperature'].plot.hist( bins = 20)

散点图?

df.plot.scatter(x = 'humidity', y = 'temperature')

箱型图

df[['temperature', 'humidity']].plot.box()

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-13 11:15:05  更:2022-09-13 11:17:08 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 23:26:36-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码