IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> python中pandas常用语法 -> 正文阅读

[人工智能]python中pandas常用语法

参考资料:

python 判断为空nan, null

python 一行代码 将小数变成百分数 - 知乎

python数据拼接: pd.concat - boobo - 博客园

Python列表解析式和生成表达式 - 知乎

Python dataframe数据 按某一列的值拆分成多个小的dataframe数据博客

统计缺失情况:

df.isnull().sum()                 --- 统计每列含有多少行数的null值,返回行数
df.isnull().sum()/df.shape[0]     --- 统计缺失的比例

df.isnull().any()                 --- 统计所有列是否有null值,返回true\false,true代表含有null值
df.isnull().any().value_counts()  --- 统计含有null的列和不含null的列分别的数量

df.isnull().T.any()
df.isnull().T.any().value_counts()--- 统计含有null的行和不含null行分别的数量

分组后统计信息:

df.groupby('year_month').count()          --- 计数
df.groupby('year_month').sum()            --- 求和
df.groupby('year_month').describe()       --- 描述性统计
df.groupby('year_month')['sku'].nunique() --- 去重数量统计
df.groupby('year_month').agg({'df_1':'sum','df_2':'max'}).reset_index() --- 不同字段个性化聚合

pd.DataFrame的用法:可以将series转为dataframe:
pd.DataFrame(df.groupby('year_month').count())

条件筛选

df[(df['sku'] == 0 )]   --- 等于
df[(df['sku']!= 0 )]    --- 不等于

df = df[(df['sku'].isin(list(set(df_1['sku']))))]  --- df的sku值需要满足在df_1的sku去重值里面

列处理

df['column_1_2'] = df['column_1'].map(str) + df['column_2'].map(str)   合并列

df['is_same_column'] =np.where(df['column_1']==df['column_2'],'same','different')

df['lenghth'] = [len(i) for i in df['sku_id']]   --- 列表表达式

关联:

pd.merge(df_1,df_2,left_on='df_1_key',right_on='df_2_key',how='left') ?

? 个性化输出:

print(i+'的比例:'+str('{:.2%}'.format(rate)))  --- 循环输出百分比

print(pd.concat([df_1.groupby('year_month')['sku'].nunique(),
                 df_2.groupby('year_month')['sku'].nunique(),                   
                 df_3.groupby('year_month')['sku'].nunique()],axis=1))   --- 横向拼接


df.to_excel('本地df.xlsx',index=False)         --- 输出成excel

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-28 11:16:07  更:2021-11-28 11:16:54 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 3:54:59-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码