IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Pandas笔记 · DataFrame数据结构与构建方法 -> 正文阅读

[人工智能]Pandas笔记 · DataFrame数据结构与构建方法

1. DataFrame数据结构

在这里插入图片描述
DataFrame的数据结构与一张数据表是非常相似的,上图对于DataFrame的解释已经一目了然了。唯一需要特别解释一下的是Index。在DF中,如不特别指定,DF总是默认为每一行数据生成Index,这个Index就是从0开始的自增索引,和数组中的Index是一样的。与此同时,用户还可以使用某一列(甚至多列)来作为Index,取代默认的索引值。细节可参考下一节。

2. 如何构建DataFrame

对于DataFrame的构建,下图给了非常形象地总结:

在这里插入图片描述

以下是参考代码:

import pandas as pd
from collections import OrderedDict
from datetime import date

2.1. 按行构建

2.1.1. 使用Dictionary按行构建

sales = [{'account': 'Jones LLC', 'Jan': 150, 'Feb': 200, 'Mar': 140},
         {'account': 'Alpha Co',  'Jan': 200, 'Feb': 210, 'Mar': 215},
         {'account': 'Blue Inc',  'Jan': 50,  'Feb': 90,  'Mar': 95 }]
df = pd.DataFrame(sales)

使用Dictionary按行构建,就是典型的KV模式,一个Dict一行,K是列名,V是对应值。这一方式易读,最符合人们的常规习惯,但是列名重复出现多次,比较繁琐。

2.1.2. 使用List按行构建

sales = [('Jones LLC', 150, 200, 50),
         ('Alpha Co', 200, 210, 90),
         ('Blue Inc', 140, 215, 95)]
labels = ['account', 'Jan', 'Feb', 'Mar']
df = pd.DataFrame.from_records(sales, columns=labels)

使用List按行构建时,是一行一行的纯数据填写,列名单独指定,这样构建效率要高很多!

2.2. 按列构建

2.2.1. 使用Dictionary按列构建

sales = {'account': ['Jones LLC', 'Alpha Co', 'Blue Inc'],
         'Jan': [150, 200, 50],
         'Feb': [200, 210, 90],
         'Mar': [140, 215, 95]}
df = pd.DataFrame.from_dict(sales)

使用Dictionary按列构建时,Dict的K是列名,V是这一列的所有值。 这一方式也很高效,没有冗余数据输入。

2.2.2. 使用List按列构建

sales = [('account', ['Jones LLC', 'Alpha Co', 'Blue Inc']),
         ('Jan', [150, 200, 50]),
         ('Feb', [200, 210, 90]),
         ('Mar', [140, 215, 95]),
         ]
df = pd.DataFrame.from_items(sales)

使用List按列构建时,与使用Dictionary按列构建类似,但是比较扭曲,这时的List只有两个元素,第一个是K,第二个是V!

本章节参考自:https://pbpython.com/pandas-list-dict.html

3. 使用set_index重置索引

如上所述,DF总会生成一个默认的类似数组索引的默认索引,但是用户可以灵活的使用数据本身的一些列作为索引。比如当数据是从数据表中导出的时候,完全可以使用原始表中的ID列作为DF的Index。

重置索引使用set_index方法。如下示意图形象地演示了它的处理逻辑:

import numpy as np
import pandas as pd

df = pd.DataFrame({'month': [2, 5, 8, 10],
                   'year': [2017, 2019, 2018, 2019],
                   'sale': [60, 45, 90, 36]})

df.set_index('month')

在这里插入图片描述
本章节参考自: https://www.w3resource.com/pandas/dataframe/dataframe-set_index.php

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-04 13:27:05  更:2021-12-04 13:29:12 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 0:50:13-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码