开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> Python常用技巧汇总（持续更新） -> 正文阅读

[人工智能]Python常用技巧汇总（持续更新）

窗口函数rolling()

自建数据：

import pandas as pd
df = pd.DataFrame({"a": [10, 20, 10, 60, 40, 20, 50]})
df

输出：

	a
0	10
1	20
2	10
3	60
4	40
5	20
6	50

下进行如下操作：
b: 逐三行求和
c: 逐三行求和并放置在中间行（两行的中间行是靠下的那个）
d: 逐三行求最大
e: 逐三行求最小
f: 逐三行求均值

df['b'] = df['a'].rolling(3).sum()
df['c'] = df['a'].rolling(3, center=True).sum()
df['d'] = df['a'].rolling(3).max()
df['e'] = df['a'].rolling(3).min()
df['f'] = df['a'].rolling(3).mean()
df

输出结果:

a	b	c	d	e	f
0	10	NaN	NaN	NaN	NaN
1	20	NaN	40.0	NaN	NaN
2	10	40.0	90.0	20.0	10.0
3	60	90.0	110.0	60.0	10.0
4	40	110.0	120.0	60.0	10.0
5	20	120.0	110.0	60.0	20.0
6	50	110.0	NaN	50.0	20.0

format string

避免重复书写的好帮手。

labels = ["{0} - {1}".format(i, i + 9) for i in range(0, 100, 10)]
labels

输出：
[‘0 - 9’,
‘10 - 19’,
‘20 - 29’,
‘30 - 39’,
‘40 - 49’,
‘50 - 59’,
‘60 - 69’,
‘70 - 79’,
‘80 - 89’,
‘90 - 99’]

格式二：

[f'x is {x}' for x in range(10) ]

输出：
[‘x is 0’,
‘x is 1’,
‘x is 2’,
‘x is 3’,
‘x is 4’,
‘x is 5’,
‘x is 6’,
‘x is 7’,
‘x is 8’,
‘x is 9’]

一个方框‘[]’是Series, 两个方框‘[[]]’是DataFrame

例如已有如下DataFrame，名字叫‘df’：

a	b	c	d	e	f
0	10	NaN	NaN	NaN	NaN
1	20	NaN	40.0	NaN	NaN
2	10	40.0	90.0	20.0	10.0
3	60	90.0	110.0	60.0	10.0
4	40	110.0	120.0	60.0	10.0
5	20	120.0	110.0	60.0	20.0
6	50	110.0	NaN	50.0	20.0

取a列：

一个‘[]’：
两个‘[[]]’：

某个结构后面想用函数可以按‘ tab’键

DadaFrame中取值一般是‘[]’，取函数一般是‘（）’

存文件可以考虑pickle或者parquet

在这里插入图片描述

它是存成二进制文件，读写比csv快。

Catogorical 类别变量

无序的
不用举例了吧，猫啊，狗的，无序。
有序的

分箱操作

cut()
qcut()

DataFrame自带画图方法，无需导入seaborn或matplotlib

在这里插入图片描述
还可以是这些：

apply()

Series的apply()
DataFrame的apply()

axis=0是index间操作，axis=1是columns间操作

每列都统计value_counts（）

在这里插入图片描述

按某列排序

在这里插入图片描述

DataFrame迭代

按列迭代
按行迭代

pivot()

在这里插入图片描述

pivot_table()

在这里插入图片描述

crosstab()

在这里插入图片描述

正则表达式

df['url'] = df['url'].apply(lambda x: re.sub(':4443',':4442',x))

apply默认是行间的操作，这里把每行url列的3替换成了2

待更新：时间模块 datetime（）

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2021-12-28 22:55:34 更:2021-12-28 22:56:11

360图书馆购物三丰科技阅读网日历万年历 2026年3日历

-2026/3/31 3:59:23-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码