IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 回归分析(三)—— 多元线性回归 -> 正文阅读

[数据结构与算法]回归分析(三)—— 多元线性回归

主要内容
回归分析概述
一元线性回归分析
多元线性回归
逻辑回归
其他回归分析

三、多元线性回归

在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响。也就是说,一个因变量和多个自变量有依存关系,而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能忽略。这时采用一元回归分析进行预测难以奏效,需要多元回归分析。

多元线性回归模型

多元回归分析是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时称为多元线性回归分析。

在这里插入图片描述
在这里插入图片描述
建立多元线性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:

(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;
(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;
(3)自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自变量与因变量之间的相关程度;
(4)自变量应具有完整的统计数据,其预测值容易确定。

多元线性回归模型的参数估计

在这里插入图片描述
多元线性回归的假设检验及其评价

1.将回归方程中所有变量作为一个整体来检验它们与因变量之间是否具有线性关系(方差分析法、复相关系数);
2.对回归方程的预测或解释能力做出综合评价(决定系数);
3.在此基础上进一步对各个变量的重要性作为评价(偏回归平方和、t检验和标准回归系数)。

多元线性回归的Python实现
(1)导入数据集

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import datasets
d = datasets.load_boston()
data = pd.DataFrame(d.data)
data['price'] = d.target
data.sample(5)

在这里插入图片描述

(2)多元线性回归建模

from sklearn.linear_model import LinearRegression
simple2 = LinearRegression()
from sklearn.model_selection import train_test_split
x = d.data  # 样本的特征值
y = d.target  # 样本的目标值
x_train,x_test,y_train,y_test = train_test_split(x,y,random_state=666)
simple2.fit(x_train,y_train)
print('多元线性回归模型系数:\n',simple2.coef_)
print('多元线性回归模型常数项:',simple2.intercept_)
y_predict = simple2.predict(x_test)

# 多元线性回归模型系数:
#  [-7.18193450e-02  5.30929833e-02  8.89401987e-02  2.58828338e+00
#  -1.68736702e+01  4.16057016e+00  1.12240087e-02 -1.39942513e+00
#   3.12802694e-01 -1.48923405e-02 -9.90156198e-01  1.30697538e-02
#  -5.27263444e-01]
# 多元线性回归模型常数项: 32.26723715046194

(3)模型分析

# sklearn.metrics 评价指标
from sklearn.metrics import mean_absolute_error  # 平均绝对误差
from sklearn.metrics import mean_squared_error  # 均方误差损失
from sklearn.metrics import r2_score  # 回归模型评价指标R2_score
print('预测值的均值误差:',mean_squared_error(y_test,y_predict))
print(r2_score(y_test,y_predict))
print(simple2.score(x_test,y_predict))
print('各特征间的系数矩阵:\n',simple2.coef_)
print('影响房价的特征排序:\n',np.argsort(simple2.coef_))
print('影响房价的特征排序:\n',d.feature_names[np.argsort(simple2.coef_)])

# 预测值的均值误差: 24.995009571399635
# 0.6499762439230528
# 1.0
# 各特征间的系数矩阵:
#  [-7.18193450e-02  5.30929833e-02  8.89401987e-02  2.58828338e+00
#  -1.68736702e+01  4.16057016e+00  1.12240087e-02 -1.39942513e+00
#   3.12802694e-01 -1.48923405e-02 -9.90156198e-01  1.30697538e-02
#  -5.27263444e-01]
# 影响房价的特征排序:
#  [ 4  7 10 12  0  9  6 11  1  2  8  3  5]
# 影响房价的特征排序:
#  ['NOX' 'DIS' 'PTRATIO' 'LSTAT' 'CRIM' 'TAX' 'AGE' 'B' 'ZN' 'INDUS' 'RAD'
#  'CHAS' 'RM']
  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2021-08-08 11:34:33  更:2021-08-08 11:50:42 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 18:38:35-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码