IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 01_pandas导入数据 -> 正文阅读

[Python知识库]01_pandas导入数据

import pandas as pd

pd.set_option()

# 显示的最大列数,None显示所有
pd.set_option("display.max_columns", None)

# 显示的最大行数,None显示所有
# pd.set_option("display.max_rows", None)

# 用于设置列中单独元素的最大长度,默认为50
# pd.set_option("max_colwidth", None)

# 当列数超出显示范围时,是否换行输出
pd.set_option("expand_frame_repr", False)

# 显示小数点后的位数
# pd.set_option('precision', 3)

pd.read_csv()

还有read_table、read_excel、read_json等,他们的参数内容都是大同小异

df = pd.read_csv(
    filepath_or_buffer=r"D:\PyProjects\pandas\data\sh600000.csv", # 文件路径
    encoding='gbk', # 编码格式
    skiprows=1, # 跳过数据文件的第一行
#     sep=',', # 该参数代表数据的分隔符,csv文件默认是逗号。其他常见的是'\t'
#     nrows=10, # 只读取前n行数据,若不指定,读入全部的数据
#     parse_date=['交易日期'],# 将指定列的数据识别为日期格式。若不指定,时间数据将会以字符串形式读入。
    index_col=['交易日期'], # 指某列作为索引列
#     usecols=['交易日期', '收盘价'], # 读取指定的列数据,其他数据不读取时
    error_bad_lines=False, # 当某行数据有问题时,报错。设定为False时即不报错,直接跳过该行。当数据比较脏乱的时候用这个
    na_values='NULL', # 将数据中的null识别为空值
)
df
股票代码股票名称开盘价最高价最低价收盘价前收盘价成交量成交额
交易日期
1999-11-10sh600000浦发银行29.5029.8027.0027.7510.00174085100.04.859102e+09
1999-11-11sh600000浦发银行27.5828.3827.5327.7127.7529403500.08.215822e+08
1999-11-12sh600000浦发银行27.8628.3027.7728.0527.7115008000.04.215916e+08
1999-11-15sh600000浦发银行28.2028.2527.7027.7528.0511921100.03.329528e+08
1999-11-16sh600000浦发银行27.8827.9726.4826.5527.7523223100.06.289083e+08
..............................
2019-03-29sh600000浦发银行10.9811.3010.9811.2811.0360526266.06.784365e+08
2019-04-01sh600000浦发银行11.3611.5211.2911.4411.2870637405.08.086575e+08
2019-04-02sh600000浦发银行11.5011.5211.4111.4411.4446714710.05.348968e+08
2019-04-03sh600000浦发银行11.3711.5411.3411.5011.4450271029.05.757994e+08
2019-04-04sh600000浦发银行11.5511.7111.5411.7111.5075232527.08.760995e+08

4582 rows × 9 columns

type(df)
pandas.core.frame.DataFrame
df.dtypes
股票代码     object
股票名称     object
开盘价     float64
最高价     float64
最低价     float64
收盘价     float64
前收盘价    float64
成交量     float64
成交额     float64
dtype: object
df.shape
(4582, 9)
df.index
Index(['1999-11-10', '1999-11-11', '1999-11-12', '1999-11-15', '1999-11-16',
       '1999-11-17', '1999-11-18', '1999-11-19', '1999-11-22', '1999-11-23',
       ...
       '2019-03-22', '2019-03-25', '2019-03-26', '2019-03-27', '2019-03-28',
       '2019-03-29', '2019-04-01', '2019-04-02', '2019-04-03', '2019-04-04'],
      dtype='object', name='交易日期', length=4582)
df.columns
Index(['股票代码', '股票名称', '开盘价', '最高价', '最低价', '收盘价', '前收盘价', '成交量', '成交额'], dtype='object')
df.info()
<class 'pandas.core.frame.DataFrame'>
Index: 4582 entries, 1999-11-10 to 2019-04-04
Data columns (total 9 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   股票代码    4582 non-null   object 
 1   股票名称    4582 non-null   object 
 2   开盘价     4582 non-null   float64
 3   最高价     4582 non-null   float64
 4   最低价     4582 non-null   float64
 5   收盘价     4582 non-null   float64
 6   前收盘价    4582 non-null   float64
 7   成交量     4582 non-null   float64
 8   成交额     4582 non-null   float64
dtypes: float64(7), object(2)
memory usage: 358.0+ KB
df.describe()
开盘价最高价最低价收盘价前收盘价成交量成交额
count4582.0000004582.0000004582.0000004582.0000004582.0000004.582000e+034.582000e+03
mean15.63541515.90977315.39579215.65006115.6404265.692092e+078.154719e+08
std8.7216358.9809828.5016458.7416888.7373629.247712e+071.331689e+09
min6.4600006.6500006.4100006.4800006.4800002.711200e+053.964432e+06
25%9.7600009.8800009.6600009.7500009.7500007.460875e+068.924417e+07
50%13.02500013.25000012.89000013.05000013.0400002.577607e+073.927869e+08
75%18.30000018.67000018.02750018.40000018.3875006.659754e+079.631053e+08
max61.00000061.97000059.00000061.59000061.5900001.198024e+091.383364e+10
  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-09-29 10:12:29  更:2021-09-29 10:13:36 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/15 17:52:51-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码