IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 【DS | Coursera】Quzi 总结 | Introduction to Data Science in Python -> 正文阅读

[Python知识库]【DS | Coursera】Quzi 总结 | Introduction to Data Science in Python


前言

本章内容主要记录了4周内的Quiz遇到的一些值得注意的点。


一、Quiz1

在这里插入图片描述

在这里插入图片描述

??本题需要注意的点是,在np的array矩阵中,我们发现reshape中,加不加第二个参数是有区别的,我们来看一下:
在这里插入图片描述
??可以发现,np中(400,)和(400,1)存在较大的区别,后者就在运算时产生广播效应,前者不会,这是因为,在(400,)中,意思是一维数组,共400个元素,而在(400,1)中,是二维数组,每一行有一个元素,共400行。也可以从形成的角度来看为什么是这样:

在这里插入图片描述

在这里插入图片描述

??这里要注意随机数生成中第二个参数表示产生的列数,且np.linspace的第三个参数是整个数组元素的个数,而np.array的第三个参数是数字元素之间的差,第二个元素是不好包含在内的就可以了

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
??'^’在开头是Anchors位置符,在正则规则中是否定符

在这里插入图片描述
??贪婪模式下会匹配尽可能多的字段

在这里插入图片描述
??\s不仅仅包含空格,它也可以用于识别文本末尾的不间断空白符号\xa0,或者全角空白符等等,例如:
在这里插入图片描述

在这里插入图片描述
??区分’?=’ ‘?<=’ ‘?!’ ‘?<!=’,正则规则可见本文第三章

在这里插入图片描述


二、Quiz2

在这里插入图片描述
??np.nan不等于np.nan,np.nan也不等于None,np.nan is None也是错误的,nan只能用np.isnan()来判断

在这里插入图片描述
3.
在这里插入图片描述
??这里是要选错误的,rename返回的是df的一个副本,记得要’保存’或者用inplace=True

在这里插入图片描述
??df.where不会删除nan的行,会输出nan

在这里插入图片描述
??类数组对象 (array-like object)可以用于创建Series,dict、array、Series可以创建DataFrame

在这里插入图片描述
??drop函数默认的参数是index,如果要删除columns需要写axis=1

在这里插入图片描述
??loc查询的是index的值,iloc查询index的位置

在这里插入图片描述
??区分method(意思是功能或函数,一般后面会加括号,可以传入参数)和attribute(属性,不能传入参数)

在这里插入图片描述
??boolean mask操作符是&(和)或者|(或),这里第三项只能得到boolean mask,不能得到df矩阵

在这里插入图片描述
如果要查询DataFrame中某行的数据,可以用.loc或者直接转置过来后当列名来直接取,可见本文2.3章


三、Quiz3

在这里插入图片描述

merge函数的使用可见本文1.1章

在这里插入图片描述
apply函数的使用可见本文第2章
3.
在这里插入图片描述
4.在这里插入图片描述
数据透视表可见本文第5章

在这里插入图片描述
11.29日周四,月末11月30日周五

在这里插入图片描述
分组后用每一组的平均值来填充平均值。

在这里插入图片描述

在这里插入图片描述
用dict实现对不同列进行不同的聚合函数

9

在这里插入图片描述
10.
在这里插入图片描述
??groupby()内的参数可以是单一列名或者列名的list,默认值axis=0,按一列中不同的行属性分组


四、Final Quiz

在这里插入图片描述

在这里插入图片描述
??re.split()分割后不会保留用于分割的值,长度为3,re.match()和re.search()返回re.Match object,多用于做bool值,也可以在上面找到匹配值和所在位置span,这个object不可以作用len()函数,也不是boolean值,但可以放在if语句中直接充当boolean值:

import re
s = 'ABCAC'
if re.match('A', s) :
    print(1)
    
--Outputs:
1

在这里插入图片描述
??正则规则中.表示匹配所有字符,?=表示匹配后面的字符但不保存A{3}表示只匹配AAA

在这里插入图片描述
??Series的省略模式可以直接表示index位置或者index值。
??例如,df[0]既可以匹配第0位置上的值,也可以匹配index为0的值,但当index为数字时,pandas会匹配index的值而不是位置,如下,我们看到a[1]在其中无法再匹配1这个位置上的值,二a[0]也只能匹配index为0的值。

在这里插入图片描述
??df.index得到的是df的index属性,第0个就是‘d’

在这里插入图片描述
??pandas 中add函数的参数如下:

??DataFrame.add(other, axis='columns', level=None, fill_value=None)

??fill_value表示对NaN值的填充,默认是无填充,所以两个数据相加如果一个是NaN,那结果就是NaN

在这里插入图片描述
??df.set_index()会将index删除,reset_index则会保留原index并生成一个正整数列index

在这里插入图片描述

在这里插入图片描述
??apply默认对行进行操作,即传入apply中的参数是df中的每一列

在这里插入图片描述
??每一次.stack()是把最细分的列变量放到最细分的索引变量中,unstack()则相反,而你可以对所有的df或者Series进行unstack()操作,但不能对Series进行stack()操作(见这篇文章5.4更换数据透视表的形状),这说明行列完全互换,只能用多个unstack()叠加,而不能用多个stack()叠加。

在这里插入图片描述

  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2022-01-01 13:51:09  更:2022-01-01 13:52:02 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/16 3:45:14-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码