[人工智能] 7. Pandas高效化运算与时间序列处理

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 7. Pandas高效化运算与时间序列处理 -> 正文阅读

[人工智能]7. Pandas高效化运算与时间序列处理

第1关：字符串操作方法

任务：读取step1/bournemouth_venues.csv文件，获取Venue Name列，通过向量化字符串操作得到清洗后的数据。

import pandas as pd

def demo():
    #********** Begin **********#
    data=pd.read_csv('./step1/bournemouth_venues.csv')
    data=data['Venue Name']
    data=data.str.split().str.get(-1)
    data=data.str.replace("P.*","")
    data.drop(data[data.values==""].index,inplace = True)
    data1=data.str.contains("[a-zA-Z]+")
    data.drop(data1[data1==False].index,inplace=True)
    return data
    # ********** End **********#

第2关：Pandas的日期与时间工具

任务：根据预期输出，创建三种不同索引的数据结构。

import pandas as pd

date_number = input()
# ********** Begin ********** #
print(pd.date_range(date_number, periods=10))
print(pd.period_range(date_number, periods=10))
print(pd.timedelta_range('1 hours', periods=10, freq='H'))
# ********** End ********** #

第3关：Pandas时间序列的高级应用

根据相关知识完成下列任务：

求上个季度（仅含工作日）的平均值；
求每个月末（仅含工作日）的收盘价；
迁移数据365天；
求一年期移动标准差。

import matplotlib.pyplot as plt
import pandas as pd

def demo():
    yahoo = pd.read_csv("./step3/yahoo_data.csv")
    yahoo.set_index(pd.to_datetime(yahoo["Date"]),inplace=True)
    # 取雅虎股票的收盘价
    yh = yahoo["Close"]

    fig, ax = plt.subplots(2, sharex=True)
    # 画出收盘价的图
    yh.plot(ax=ax[0], style="-")
    # 求上个季度(仅含工作日)的平均值
    # ********** Begin ********** #
    data1=yh.resample('BQ').mean()
    # ********** End ********** #
    data1.plot(ax=ax[0], style=":")
    # 求每个月末(仅含工作日)的收盘价
    # ********** Begin ********** #
    data2=yh.asfreq('BM')
    # ********** End ********** #
    data2.plot(ax=ax[0], style="--", color="red")
    ax[0].legend(['input', 'resample', 'asfreq'], loc='upper right')
    # 迁移数据365天
    # ********** Begin ********** #
    data3=yh.shift(365)
    # ********** End ********** #
    data3.plot(ax=ax[1])
    data3.resample("BQ").mean().plot(ax=ax[1], style=":")
    data3.asfreq("BM").plot(ax=ax[1], style="--", color="red")
    # 设置图例与标签
    local_max = pd.to_datetime('2007-11-05')
    offset = pd.Timedelta(365, 'D')
    ax[0].axvline(local_max, alpha=0.3, color='red')
    ax[1].axvline(local_max + offset, alpha=0.3, color='red')
    # 求一年期移动标准差
    # ********** Begin ********** #
    rolling=yh.rolling(365,center=True)
    data4=rolling.std()
    # ********** End ********** #
    data4.plot(ax=ax[1], style="y:")
    data4.plot(ax=ax[0], style="y:")
    plt.savefig("./step3/result/2.png")

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-04-04 12:11:32 更:2022-04-04 12:16:20

360图书馆购物三丰科技阅读网日历万年历 2025年2日历

-2025/2/21 3:34:25-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码