1.Padas做数据读取
前言
笔者最近正在学习Pandas数据分析,将自己的学习笔记做成一套系列文章。
一、pandas是什么?
Pandas,python+data+analysis的组合缩写,是python中基于numpy和matplotlib的第三方数据分析库,与后两者共同构成了python数据分析的基础工具包,享有数分三剑客之名。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。
二、pandas读取数据
1.读取csv数据
官方文档 但是官方文档的一个缺点就是太复杂了,我在此据几个例子来便于读者的理解。 600033.csv文件数据:
代码如下:
import pandas as pd
fpath="./600033.csv"
ratings=pd.read_csv(fpath)
ratings.head()
结果:
ratings.shape
ratings.columns
ratings.index
ratings.dtypes
读取txt文件表格内容: date.txt文件内容:
path="./date.txt"
pvuv=pd.read_csv(
fpath,
sep="\t",
header=None,
names=["属性1","属性2","属性3"])
pvuv
结果:
采用如下方法设置表格头部: 即通过header=[0]设置第0行数据就是dataFrame的头部。
2.读取excel表格数据
自选股数据记录.xlsx"文件内容:
代码如下:
fpath="./自选股数据记录.xlsx"
pvuv=pd.read_excel(fpath)
pvuv
3.读取sql数据库数据
数据库数据内容:
代码如下:
import pymysql
conn=pymysql.connect(
host='127.0.0.1',
user='root',
password='root',
database='pandas',
charset='utf8'
)
mysql_page=pd.read_sql("select * from data1",con=conn)
mysql_page
结果:
4.pandas读取文件做日期解析parse_dates
在read_csv() 方法中有一个参数是parse_dates ,这个param表示的是我们要指定日期解析的列,我在进行股票量化的时候就需要去解析时间列。
总结
这就是pandas大概读取数据的基本用法了,希望可以帮助到你。
|