IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> python数据分析:Pandas之Series -> 正文阅读

[Python知识库]python数据分析:Pandas之Series

1 Series简介

Pandas 是python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。

pandas的两大主要数据结构 Series和DateFrame,其中Series 是带标签的一维数组,可存储整数、浮点数、字符串、Python 对象等类型的数据。轴标签统称为索引,它由两部分组成。

values:一组数据(ndarray类型)
index:相关的数据索引标签
在这里插入图片描述
特点:数据对齐事内在的,标签与数据默认对齐,除非特殊情况,一般不会断开连接,因此通过索引取值非常方便,不需要循环,可以直接通过字典方式,key 获取value

2 Series 创建的几种方式

2.1 列表创建

import pandas as pd
#Series组成部分:pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)
lst = [1,3,5,6,10,23]
s = pd.Series(lst) # 可以通过index指定索引,如果不指定索引,则会自动从0开始生成索引,我们叫做隐式索引
s
lst = [1,3,5,6,10,23]
s = pd.Series(lst,index=["A","B","C","D","E","F"]) # 通过index设置显式索引
s

2.2 numpy创建

s = pd.Series(np.random.randint(1,10,size=(3,)),index=['a','b','c'])
s

2.3 字典创建

dic = {"A":1,"B":2,"C":3,"D":2}
s2 = pd.Series(dic)
s2

3 Series的索引和切片

因为Series只有一列,因此一般只对行进行操作,索引分为隐式索引和显示索引,因此不同的方式操作起来也不一样。

3.1 Series隐式索引的操作

lst = [1,3,5,6,10,23]
s = pd.Series(lst)

s[0] 取某一行,也可以说取某个元素
s[[0,1]] 取多行时,里面则是列表,可存储多个
s[0:2] 切片操作,取0-2行,但是只能取到0和1行,顾头不顾尾
s.iloc[0:2] 使用iloc来专门对隐式索引进行相关操作,也是只能取到0和1行,顾头不顾尾
s.iloc[[0,1]] 使用iloc来专门对隐式索引进行相关操作,跟s[[0,1]]一样
这里就不一一举例了,我可是一个一个都试过的。

3.2 Series显式索引的操作

lst = [1,3,5,6,10,23]
s1 = pd.Series(lst,index=["A","B","C","D","E","F"])

s1[“A”] 取某行或单个元素
s1[[“A”,“B”]] 取多行,可以是连续的,也可以是不连续的
s1[“A”:“B”] 切片,取A行和B行,这里的B行是可以取到的,头和尾都可以取到
s1.loc[“A”:“B”] 使用loc来专门对显式索引进行相关操作,这里的B行也可以取到
s1.loc[[“A”,“B”]] 使用loc来专门对显式索引进行相关操作
总结
Series的索引和切片只针对行而言,因为它只有一列
loc是对于显式索引的相关操作(对于标签的处理),iloc是针对隐式索引的相关操作(对于整数的处理)。
我们发现其实s[0:2] 与 s.iloc[0:2]没有太大差别(显式索引也是一样),这并不说明iloc就没有用,个人觉得它更有意义的是在DataFrame当中使用,后面会讲到。

4 Series的基本操作

4.1 显示Series部分数据内容

s.head(n) 该函数代表的意思是显示前多少行,可以指定显示的行数,不写n默认是前5行
s.tail(n) 该函数代表的意思是显示后多少行,可以指定显示的行数,不写n默认是前5行

lst = [1,3,5,6,10,23]
s1 = pd.Series(lst,index=["A","B","C","D","E","F"])

s1.head() # 显示前5行

s1.tail() # 显示后5行

4.2 Series去重操作

s.unique() 结果为一维数组

dic = {"A":1,"B":2,"C":3,"D":2}
s2 = pd.Series(dic)

s2.unique() # 原s2并未修改,该结果返回的是一维数组

4.3 Series的相加运算

Series相加,会根据索引进行操作,索引相同则数值相加,索引不同则返回NaN

NaN在pandas解释中为 not a number ,它是float类型,表示缺失数据,可以参与运算。

#s1
lst = [1,3,5,6,10,23]
s1 = pd.Series(lst,index=["A","B","C","D","E","F"])
#s2
dic = {"A":1,"B":2,"C":3,"D":2}
s2 = pd.Series(dic)

s3 = s2+s1

4.4 Series缺失值操作

查看Series中哪些是NaN

二者都是判断是否为空,返回的结果为True或False

s.notnull() 不为空返回True,为空返回False
s.isnull() 不为空返回False,为空返回True

s3.isnull()

s3.notnull()
  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-07-13 17:25:22  更:2021-07-13 17:25:55 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/4 15:39:28-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码