IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> pandas表操作 -> 正文阅读

[Python知识库]pandas表操作

# -*- coding:utf-8
import pandas as pd
import numpy as np
import datetime
from pylab import *
#设置界面显示的最大行列数据量
from pandas.tests.plotting.test_converter import dates

pd.options.display.max_colums = 10
#读取数据
df = pd.read_csv("*.csv")
#查看数据量、数据指标和数据维度
print(df.shape)
#查看数据的尺寸大小
print(df.size)
#查看前N条数据
df.head()

#对缺失值的处理
df1 = df.reindex(index=dates[:4],columns=["ABCD"]+["G"])
df1.loc[dates[0]:dates[1],"G"] = 1
print(df1)
print(df1.dropna())
print(df1.fillna(value=2))

#statistic
print(df.mean)
print(df.var())
s = pd.Series([1,2,4,np.nan,5,7,9,10],index = dates)

print(s)
print(s.shift(2))
print(s.diff())
print(df.apply(np.cumsum))
print(df.apply(lambda x:x.max()-x.min()))

#Concat
pieces = [df[:3],df[-3:]]
print(pd.concat(pieces))
left = pd.DataFrame({"key":["x","y"],"value":[1,2]})
right = pd.DataFrame({"key":["x","z"],"value":[3,4]})
print("LEFT",left)
print("RIGHT",right)
print(pd.merge(left,right,on="key",how="left"))#how="inner"
df3 = pd.DataFrame({"A",["a","b","c","d"],"B":list(range(4))})
print(df3.groupby("A").sum())

#Reshape   交叉分析中起注释作用
df4 = pd.DataFrame({'A':['one','one','two','three']*6,
                    'B':['a','b','c']*8
                    'C':['foo','foo','bar','bar','bar','bar'] * 4,
                    'D':np.random.randn(24),
                    'E':np.random.randn(24),
                    'F':[datetime.datetime(2017,i,1) for i in range(1,13)]+
                        [datetime.datetime(2017,i,15) for i in range(1,13)]})
#做透视表
print(pd.pivot_table(df4,values="D",index=["A","B"],columns=["C"]))

# Time Series 时间序列
t_txam = pd.date_range("20170301",periods=10,freq="S")
print(t_txam)

#Graph 画图
ts = pd.Series(np.random.randn(1000),index = pd.date_range("20170301",periods=1000))
ts = ts.cumsum()
ts.plot()
show()
#File 文件操作



  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-07-28 07:42:06  更:2021-07-28 07:44:42 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年4日历 -2024/4/19 8:10:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码