| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 数学建模-分类模型(基于logistic回归) -> 正文阅读 |
|
[人工智能]数学建模-分类模型(基于logistic回归) |
基于logistic回归的分类模型:
逻辑回归的要求(针对01)
ps. 如何检验假设5-7,并进行Logistics回归 参考: 二分类logistic回归,更新几个常见问题的解决方法 所要解决的问题逻辑回归的结果一般用于估计某种事物的可能性(“可能性”,而非数学上的“概率”),不可以直接当做概率值来用。该结果往往用于和其他特征值加权求和,而非直接相乘。 逻辑回归可以用于预测在给定的过程中,系统或产品的故障的可能性。还用于市场营销应用程序,例如预测客户购买产品或中止订购的倾向等。在经济学中它可以用来预测一个人选择进入劳动力市场的可能性,而商业应用则可以用来预测房主拖欠抵押贷款的可能性。则可以根据logistic回归模型,预测在不同的自变量情况下,发生某病或某种情况的概率有多大。最初由Boyd 等人开发的创伤和损伤严重度评分(TRISS)被广泛用于预测受伤患者的死亡率,使用逻辑回归 基于观察到的患者特征(年龄,性别,体重指数,各种血液检查的结果等)分析预测发生特定疾病(例如糖尿病,冠心病)的风险。 逻辑回归模型现在同样是很多分类算法的基础组件。 逻辑回归原理逻辑回归一种广义线性回归模型,逻辑回归假设因变量 y 服从伯努利分布,在线性回归基础上利用Sigmoid映射函数来实现。其主要用于分类。它在线性回归的基础上加入了sigmoid函数,将线性回归的结果输入至sigmoid函数中,并且设定一个阈值,如果大于阈值为1,小于阈值为0。通过Sigmoid函数引入了非线性因素,因此可以轻松处理0/1分类问题。 标准线性回归: 二元逻辑回归1. 使用场景2. 使用方法利用Spss软件
具体使用方法: 输出结果分析: 多元逻辑回归核心: Sigmoid函数 推广为 Softmax函数 1. 使用场景在实际应用中,可能还会碰到因变量是多个分类的情况,并且不包含排序信息 2. 使用方法注意,这里要将几个自变量放到协变量中。
多因素logistic回归分析spss步骤:打开数据,依次点击:analyse–regression–binarylogistic,打开二分回归对话框 注意事项a. 交互项的影响如果想要进行交互作用的分析,同时选中两个自变量,将两个变量的交互作用项选入方程来进行分析。 b.如何确定合适的模型把数据分为训练组和测试组,用训练组的数据来估计出模 (注意:为了消除偶然性的影响,可以对上述步骤多重复几次,最 可在logistic回归模型中加入平方项、交互项等。 c. 分类变量的转化两种方法 d. 逐步回归的设置向前(向后)逐步回归可选择的统计量有所区别。 c. 连续的自变量与因变量的logit转换值之间存在线性关系可用Box-Tidwell法检验连续的自变量与因变量的logit转换值之间是否存在线性关系,即将连续自变量与其自然对数值的交互项纳入回归方程。 e. 样本要求
f. 过拟合现象h. 多重共线性与线性回归一样,Logistic回归模型也需要检验自变量之间是否存在多重共线性。自变量之间的简单相关或多重相关都会产生多重共线性。 容忍度(Tolerance)或方差膨胀因子(VIF)可以用来诊断自变量之间的多重共线性。 如果容忍度(Tolerance)小于0.1或方差膨胀因子(VIF)大于10,则表示有共线性存在。本例中,容忍度均远大于0.1,方差膨胀因子均小于10,所以不存在多重共线性。如果数据存在多重共线性,则需要用复杂的方法进行处理,其中最简单的方法是剔除引起共线性的因素之一,剔除哪一个因素可以基于理论依据。 i. 检测没有明显的离群点、杠杆点和强影响点j. 对于输出警告的解读
k. 预处理问题在进行二分类Logistic回归(包括其它Logistic回归)分析前,如果样本不多而变量较多,建议先通过单变量分析(t检验、卡方检验等)考察所有自变量与因变量之间的关系,筛掉一些可能无意义的变量,再进行多因素分析,这样可以保证结果更加可靠。 即使样本足够大,也不建议直接把所有的变量放入方程直接分析,一定要先弄清楚各个变量之间的相互关系,确定自变量进入方程的形式,这样才能有效的进行分析。 详细见: 模型的评价1. 模型整体评价a. 模型系数的综合检验(Omnibus Tests of Model Coefficients):Omnibus Tests of Model Coefficients是模型系数的综合检验。其中Model一行输出了Logistic回归模型中所有参数是否均为0的似然比检验结果。P<0.05表示本次拟合的模型中,纳入的变量中,至少有一个变量的OR值有统计学意义,即模型总体有意义。 b. Hosmer and Lemeshow TestHosmer and Lemeshow Test是检验模型的拟合优度。当P值不小于检验水准时(即P>0.05),认为当前数据中的信息已经被充分提取,模型拟合优度较高。 c. Model Summary表格Model Summary表格中,提供了因变量的变异能够被拟合的模型解释的比例。该表格包含Cox & Snell R Square和Nagelkerke R Square,这两种R2有时被称为伪R2,在Logistic回归中意义不大(与线性回归中的不同),可以不予关注。 2. 模型预测能力对于每一个自变量组合,均可以得到结局事件发生的概率。 Variables in the Equation表格: 参考资料机器学习算法: 逻辑回归的介绍和应用 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 0:40:43- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |