IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 数据预处理--数据标准化(5) -> 正文阅读

[数据结构与算法]数据预处理--数据标准化(5)

分析:先标准化在进行随机森林的填充,避免随机填充时填充的数据太大影响标准化

先分析一下特征间数据差异过大,过大需要进行归一化(一般都要)

#量纲可视化     
#量纲分析
#指标数据化
#求出各指标中位数并且保存下来
import pandas as pd
data=pd.read_csv(r'C:\Users\44933\Desktop\数据挖掘材料\全部数据\makenomal_flag.csv',encoding='utf-8',index_col=None)
df=data.median().T
df.columns=['zhibiao','lianggang']

x1=df.iloc[:,0:1]
y1=df.iloc[:,1:2]
plt.scatter(x1,y1)
plt.show()

中位数

# 标准化    
import pandas as pd
import numpy as np
x=pd.read_csv(r'C:\Users\44933\Desktop\数据挖掘材料\全部数据\makenomal_flag.csv',encoding='utf-8')
X=x.iloc[:,2:]
Y=x.iloc[:,0:2]
def MaxMinNormalization(x):
    """[0,1] normaliaztion"""
    x = (x - np.min(x)) / (np.max(x) - np.min(x))
    return x
std=pd.concat([Y,MaxMinNormalization(X)],axis=1)
std.to_csv(r'C:\Users\44933\Desktop\数据挖掘材料\1\makestd_flag.csv',index=False)
  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2021-08-15 15:50:18  更:2021-08-15 15:51:36 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 20:38:51-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码