IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> Python知识库 -> 流水账第十章 -> 正文阅读

[Python知识库]流水账第十章

Numpy学习

数据的处理

import pandas as pd
import numpy as np
data = pd.read_csv("/Users/currystephen/Desktop/数据挖掘/Python数据分析与挖掘实战(第2版)/chapter7/demo/data/air_data.csv")

#判断是否存在缺失值
data_isnull = pd.isnull(data)    #对每个数值进行判断 ,出现False代表有值
data_any = np.any(pd.isnull(data))  #全数据判断:有一个True,返回True 说明有缺失值
print(data_any)
#等同于pd.notnull(data)     np.all(pd.notnull(data))  返回False说明有缺失值

#只用pandas
data_pd = pd.isnull(data).any() #判断每一列是否存在缺失值 False说明没有缺失值 True反之
print(data_pd)
#同理等于=  pd.notnull(data).all()   #False说明有缺失值 与上面相反

#缺失值处理
#1.删除缺失值
data1 = data.dropna()               #删除含有NA值的一整行数据  默认dropna(inplace=False)   Flase不会修改原数据  True会修改原数据
data_pd1 = pd.isnull(data1).any()  #将返回全False 表示data1没有缺失值

#2.替换缺失值  12行判断出 GENDER 、WORK_CITY 、WORK_CITY 、WORK_COUNTRY 、AGE 、SUM_YR_1 、SUM_YR_2  中含有缺失值
a = data["AGE"].fillna(data["AGE"].mean(),inplace=True)
data_pd = pd.isnull(data['AGE']).any() #判断是否有缺失值
print(data["WORK_CITY"])
#其他异常值处理
data_new = data.replace(to_replace=".",value=np.nan)   #将其他异常值替换成空值NaN
print(data_new["WORK_CITY"])
#然后在对空值进行处理 与上面一样
data1 = data_new.dropna(inplace=True)
print(data_new["WORK_CITY"])

#实现数据离散化
sr = pd.qcut(data["AGE"],4)  #对数据中"AGE"一列数值进行自动分组 分4组
counts = sr.value_counts()  #对四组分组各个多少个计数
print(counts)
print(sr)
#转化城one_hot
one_hot = pd.get_dummies(sr,prefix="年龄")
print(one_hot)

#自定义分组
bins = [6,35,41,48,110]
cut = pd.cut(data["AGE"],bins)
one_hot1 = pd.get_dummies(cut,prefix="年龄")
print(cut)
print(one_hot1)
  Python知识库 最新文章
Python中String模块
【Python】 14-CVS文件操作
python的panda库读写文件
使用Nordic的nrf52840实现蓝牙DFU过程
【Python学习记录】numpy数组用法整理
Python学习笔记
python字符串和列表
python如何从txt文件中解析出有效的数据
Python编程从入门到实践自学/3.1-3.2
python变量
上一篇文章      下一篇文章      查看所有文章
加:2021-07-27 16:10:51  更:2021-07-27 16:11:34 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/8 7:50:26-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码