| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 数据指标间相关性分析 -> 正文阅读 |
|
[人工智能]数据指标间相关性分析 |
最近想做一个自动化分析指标间相关性系数的东西,不知道能做什么东西,因为连怎么进行相关性分析都不会…… 所以就从头呗,先了解相关性分析,嘿嘿。 ?先发一版,存太久了 互联网大学中的相关性分析的各种方式汇总: 文中图片来源:相关性分析的五种方法_Munger6的博客-CSDN博客_相关性分析 1、可视化-图表 ????????折线图啊、散点图啊,把数据都放上,用sns.pairplot()😁 虽然可以清晰地看出相关关系,但是无法对相关关系进行准确的量化,到底相关系数是多少? 当数据超过两组时也无法完成各组数据间的相关分析 2、协方差及协方差矩阵 当两个变量变化趋势相同,协方差为正值,说明两变量正相关; 当两个变量变化趋势相反,协方差为负值,说明两变量负相关; 当两个变量相互独立,协方差为0,说明两变量不相关; 两个变量的协方差: ?三个变量的协方差: ?还是对变量间的相关性没有办法度量 3、相关系数(Pearson系数) Sxy:样本协方差;Sx:X样本的标准差;Sy:Y样本的标准差; 样本的协方差、标准差,分母是n-1. ? ? ?4、回归分析 一元回归: 变量系数: 多元回归: ?5、信息熵及互信息 1、计算相关性系数判断: r值代表相关性强度,取值范围为[-1,1],>0 ,为正相关。<0,为负相关。
三个相关性系数(pearson, spearman, kendall)反应的都是两个变量之间变化趋势的方向以及程度。 Pearson系数(不是p值):皮尔逊相关系数,线性相关系数,协方差与标准差的比值,对数据质量要求较高: ? ? ? ? ①数据是正态分布时,因为求皮尔森相关性系数以后,通常还会用t检验之类的方法来进行皮尔森相关性系数检验,而 t检验是基于数据呈正态分布的假设的。 ? ? ? ? ②实验数据之间的差距不能太大,不能有离散点,异常值。 ? ? ? ? ③连续性变量 Spearman系数:斯皮尔曼相关性系数,没有很多数据条件要求,当数据不是正太分布,用这个,适用范围广,适合于定序变量或不满足正态分布假设的等间隔数据 Kendall系数:肯德尔相关性系数,又称肯德尔秩相关系数,应用于 分类变量,适合于定序变量或不满足正态分布假设的等间隔数据 【统计学】区分定类、定序、定距、定比变量!!
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年2日历 | -2025/2/21 4:08:38- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |