| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> Python知识库 -> 大数据笔记2.2描述数据 -> 正文阅读 |
|
[Python知识库]大数据笔记2.2描述数据 |
01集中趋势1、k百分位数
numpy.percentile 在python中计算一个多维数组的任意百分比分位数,此处的百分位是从小到大排列,只需用np.percentile即可 shape[0]:对数组说,为其长度 对于图像来说: ? ? ? ??img.shape[0]:图像的垂直尺寸(高度) ? ? ? ??img.shape[1]:图像的水平尺寸(宽度) ? ? ? ? img.shape[2]:图像的通道数 对于矩阵来说: ? ? ? ? shape[0]:表示矩阵的行数 ? ? ? ??shape[1]:表示矩阵的列数 02离中趋势1、极差(Range)R=max-min 2、四分位数极差(InterQuartile Range,IQR)IQR=Q3-Q1 (第三四分位数-第一四分位数) 反映集合中间50%数据的变动范围 可用于发现离群点(outlier):超过Q3+1.5IQR或者低于Q1-1.5IQR可能是离群点 3、平均绝对离差(MAD)MAD=1/nΣ|xi-x| 由于带有绝对值,很少使用 4、方差和标准差(Variance and Absolute Deviation)总体标准差 σ 样本方差 s^2=Σ(xi-x)^2/(n-1) 标准差 s=sqrt( s^2) 5、离散系数(变异系数)C=s/x~ (标准差÷平均值) 注意:只对由比率标度属性计算出来的数值有意义(身高、体重、工资) 离散系数越大,说明差异越大 03分布形态1、偏度 2、峰度 04数据可视化 1、箱形图 2、偏度峰度 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/15 18:57:37- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |