IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 数据分析---pandas的高级操作 -> 正文阅读

[人工智能]数据分析---pandas的高级操作

一、替换操作(replace)

  • ?替换操作可以同步作用与Series和DataFrame中

df.replace(to_replace , value , replace , ...)? ?#将所有to_replace 替换成value

df.replace(to_replace={4:5},value='five' )? ? ?#将指定列的元素进行替换,re_place{列索引:被替换的值}

df.replace(to_replace={1:'one'} )? ? ? ? ? ? ? ? ? ?#字典形式的替换,将1替换成‘One’

二、映射操作(map)

  • 概念:创建一个映射关系列表,把values元素和一个特定的标签或者字符串绑定(给一个元素值提供不同的表现形式)——字典形式的映射关系表
  • 创建一个df,两列分别是姓名和薪资,然后给其名字起对应的英文名

Series_data. map( dic)? ? #只能给Series数据进行映射(dic)

map只能是Series的方法,只能被Series调用

?三、运算工具(map)

  • 需求:超过3000部分的钱需要缴纳50%的税,计算每个人的税后薪资

?四、排序实现的随机抽样

take([隐式索引],axis=1)? ? ? ?#将原始数据按隐式索引打乱(列打乱)

np.random.permutation(n)? ?#产生0~n的随机数

?1. 将原始数据的打乱(axis=1)?

?2. 在此基础上将原始数据的行进行打乱(axis=0)

?3. 随机取样?

?五、数据的分类处理

  • 数据分类处理的核心
    • groupby(by , )函数
    • groups属性查看分组情况?

?原始数据:

?1. 对原始数据的水果进行分类并查看分组情况

?2. 为什么要进行分组呢? 为了进行聚合【分组聚合】——计算每一种说过的平均价格

?3. 将计算出的每种颜色的平均重量汇总到源数据,需要用到映射——map(dic),字典数据。

?

?六、高级数据聚合

?当我们分好组之后,想进行一个聚合操作,但是这个聚合操作并没有被pandas封装,那么就需要我们自己封装一个聚合操作,例如mean()。

  • transform( )? ?#返回映射后的结果
  • apply( )? ?#返回没有映射的结果

?七、数据加载

1. 读取type-.txt文件

?2. 将文件中每一个词作为元素存放到DataFrame中

?3. 读取数据库中的数据

?八、透视表

  • 透视表是一种可以对数据动态排列并且 分类汇总 的表格格式。在Excel中常用,而在pandas中被称作pivot_table。
  • 透视表优点:
    • 灵活性高,可以随意定制你的分析计算要求
    • 脉络清晰易于理解数据
    • 操作性强,报表神器

1. 导入数据

2. 参数index

?3. 参数values

?4. 参数aggfunc

?5. 参数columns

?九、交叉表

  • 是一种用于计算分组的特殊透视表,对数据进行汇总
  • pd.crosstab(index,columns)
    • index:分组数据,交叉表的行索引
    • columns:交叉表的列索引

1. 原始数据

?2. 求出各个性别(列)抽烟(行)的人数

?3. 求出各个年龄段(行)抽烟(列)人的情况

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-16 22:21:38  更:2022-03-16 22:23:53 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 14:22:23-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码