IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> python + pandas数据储存 -> 正文阅读

[Python知识库]python + pandas数据储存

数据结构

Series对象 创建一维数组的对象

#默认行标签从0开始索引
s1 = pandas.Series([1, 2, 3, 4]) 
#使用自定义行标签
s2 = pandas.Series([1,2,3],index=['a','b','c'])
s3 =pandas.Series({'a':1,'b':2})

返回值

a    1
b    2
c    3
dtype: int64

DataFrame对象 二维数组对象

#创建二维数组,使用自定义行标签和列标签
s1 = pandas.DataFrame([['student1',12,89],
                    	['student2',21,90]],
                      index=['001','002'],
                      columns=['name','age','score'])

返回值

         name  age  score
001  student1   12     89
002  student2   21      0

读取数据 ——Excel表格

使用read_excel

excel = pandas.read_excel('工作簿1.xlsx',
                          sheet_name=0,
                          engine='xlrd')

默认引擎是xlrd,使用时需要安装xlrd,此外还需要安装openpyxl模块。

sheet_name=0,表示读取第一个工作表。也可使用具体表名。

指定读取数据的行、列标签

使用参数header和index_col

赋值为0时:自带的列标签没有了

none:没有改变

赋值为1:产品、金额表头没有了

在这里插入图片描述

赋值为2以此类推

使用index_col解决行标签同理

读取指定列

usecols=[2,3] 只读取第3,4列

读取前几行

使用head方法,默认是前5行

excel = pandas.read_excel('工作簿1.xlsx')
print(excel.head(3))	#读取前3行
print(excel.shape)	#(9,6)

查看数据总行数、列数——shape方法

print(excel.shape) #(9,6)

转换数据类型——astype()函数

在这里插入图片描述

选择单行、多行标签——loc和iloc

loc通过行标签选择

请添加图片描述

#多行
data.loc[['d001','d002']]

iloc通过索引来选择

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-az7C1Vgg-1631366239931)(/Users/wuyang/Library/Application Support/typora-user-images/image-20210823102207198.png)]

#多行
data.iloc[['d001','d002']]
#切片方法
data.iloc[1:2]

选择满足条件行

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jVSDYvNl-1631366239935)(/Users/wuyang/Library/Application Support/typora-user-images/image-20210823102349392.png)]

处理重复数据

planets = pd.read_csv('planets.csv')
print(planets.head(10))
planets.drop_duplicates(subset=['method','year'],keep='first',inplace=True)
print(planets.head(10))

planets.drop_duplicates(subset=[‘method’,‘year’],keep=‘first’,inplace=True)这个是最关键的语句了。
首先subset参数是一个列表,这个列表是需要你填进行相同数据判断的条件。就比如我选的条件是method和year,即 method值和year的值相同就可被判定为一样的数据。keep的取值有三个 分别是 first、last、false
keep=first时,保留相同数据的第一条。keep=last时,保存相同数据的最后一条。keep=false时,所有相同的数据都不保留。inplace=True时,会对原数据进行修改。否则,只返回视图,不对原数据修改。

追加文件内容

def append_excel(df, content_list):
    """
   excel文件中追加内容
   :return:
   df:已有表格中数据
   content_list:待追加的内容列表
   """
    ds = pandas.DataFrame(content_list)
    df = df.append(ds, ignore_index=True)
    df.to_excel('c.xlsx', index=False, header=False)
    
    #调用
append_excel(pandas.read_excel('c.xlsx', header=None), data)#使用追加形式添加数据

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-09-12 13:07:15  更:2021-09-12 13:08:32 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/27 14:10:41-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计