IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【SLAM学习笔记4】卡方检验chi-square -> 正文阅读

[人工智能]【SLAM学习笔记4】卡方检验chi-square


前言

卡方分布和卡方检验在很多地方都会用到,尤其是统计学和数据分析里。

卡方检验(chi-square,记为χ2检验)是一种计数资料的假设检验方法,因为对总体的分布不作任何假设,故属于非参数检验。

第一次碰见是在ORB-SLAM2检验单应矩阵中。

现在在卡方检验重新梳理一下。


一、卡方分布

卡方检验是基于卡方分布的一种假设检验方法。
实际观察次数fo与理论(期望)次数fe之差的平方除以理论次数fe所得的值,近似服从卡方分布。

卡方检验的公式:

在这里插入图片描述

卡方分布的定义与性质:
在这里插入图片描述
在这里插入图片描述
E(X):期望值;Var(X):方差。

通常,Xn2密度函数的定义域为(0,+∞),且自由度n越大,其密度曲线越趋近于对称;n越小,曲线越不对称。

若X ~ Xn2,记 P (x>c) = α, 则 c = Xn2(α) 则称为Xn2分布的上侧α分位数,如下图所示,gn(x)是Xn2的密度函数。

注:显著性水平是:估计总体参数落在某一区间内,可能犯错误的概率,用α表示。

当α和n给定时,可查表得到 Xn2(α)的值。如 X102(0.01) = 23.209, X52(0.05) = 12.592等。
在这里插入图片描述


二、卡方检验

卡方检验(chi-square,记为χ2检验)是一种计数资料的假设检验方法,因为对总体的分布不作任何假设,故属于非参数检验。

根本思想:比较实际频次fo与理论频次fe的吻合程度或拟合优化问题

在这里插入图片描述

使用的情况:当事实与期望不符合情况下使用卡方分布进行检验,看是否系统出了问题,还是属于正常波动。利用卡方分布分析结果,排除可疑结果。

作用:主要用于比较两个及两个以上的样本率或分类变量的关联性分析。检查实际结果与期望结果之间何时存在显著差异。

  1. 检验拟合程度:可以检验一组给定数据与指定分布的吻合程度。如:检验抽奖机收益的观察频数与我们所期望的吻合程度。
  2. 检验两个变量的独立性:通过这个方法,检查变量之间是否存在某种关系。

步骤:

  1. 确定要进行检验的假设H0,及其备择假设H1.
  2. 求出期望E.
  3. 确定用于做决策的拒绝域(右尾).
  4. 根据自由度和显著性水平查询检验统计量临界值.
  5. 查看检验统计量是否在拒绝域内.
  6. 做出决策.

显著性水平是:估计总体参数落在某一区间内,可能犯错误的概率,用α表示。
显著性水平是假设检验中的一个概念,是指当原假设为正确时人们却把它拒绝了的概率或风险。它是公认的小概率事件的概率值,必须在每一次统计检验之前确定,通常取α=0.05或α=0.01。这表明,当作出接受原假设的决定时,其正确的可能性(概率)为95%或99%。

检测标准:卡方分布检验是单尾检验且是右尾,右尾被作为拒绝域。于是通过查看检验统计量是否位于右尾的拒绝域以内,来判定期望分布得出结果的可能性。

在这里插入图片描述

计算步骤

期望频数总和与观察频数总和相等

  1. 表里填写相应的观察频数和期望频数

期望频数 = 观察频数总和*出现某种结果的概率,其实就是求期望值。
如下表的,X= -2的期待频数为977。
在这里插入图片描述

  1. 利用卡方公式计算检验统计量

在这里插入图片描述
检验统计量X2意义:fo与fe之间差值越小,检验统计量X2越小。
卡方检验的标准:如果统计量值X2很小,说明实际观察频数和期望频数之间的差别不显著;统计量越大,差别越显著。故还是越小越好。

按观察频率和期望频率表(上表),计算检验统计量X2

在这里插入图片描述

关于自由度n

自由度:用于计算检验统计量的独立变量的数目。

在这里插入图片描述
规律:

  1. 当自由度等于1或者2时:卡方分布先高后低的平滑曲线,检验统计量等于较小值的概率远远大于较大值
    的概率,即观察频数有可能接近期望频数。
  2. 当自由度大于2时:卡方分布先低后高再低,其外形沿着正向扭曲,但当自由度很大时,图形接近正态分
    布。

自由度的计算
对于单行或单列:自由度 = 组数 - 限制数

对于表格类:自由度 = (行数 - 1) * (列数 - 1)

在这里插入图片描述

查表

在这里插入图片描述

检验统计量拒绝域内外判定:

  1. 求出检验统计量a
  2. 通过自由度和显著性水平查到拒绝域临界值b
  3. a>b则位于拒绝域内;反之,位于拒绝域外。

例子:
假设自由度为4, 5%的显著水平,查表得到其拒绝域是9.49,也就是说检验统计量大于9.49位于拒绝域内。
按上面计算得到的检验统计量X2 = 38.272 > 9.49 位于拒绝域内。

决策原则

如果位于拒绝域内我们拒绝原假设H0,接受H1。
如果不在拒绝域内我们接受原假设H0,拒绝H1。

上述,因为检验统计量38.272 > 9.49 位于拒绝域内,所以拒绝原假设,接受备择假设。

比如,
原假设H0是:机器没有故障,一切正常
备择假设H1:机器故障,违反常规。


总结

本文为了ORB-SLAM2中的一些卡方检测(例如,剔除外点策略)而准备。


Reference

  1. https://blog.csdn.net/jinxiaonian11/article/details/78617936(卡方分布分析与应用)
  2. https://blog.csdn.net/anshuai_aw1/article/details/82735201(三大抽样分布:卡方分布,t分布和F分布的简单理解)【重点】
  3. @计算机视觉life课程(yyds)
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-22 12:20:40  更:2021-11-22 12:22:05 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 4:40:01-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码