IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用 -> 正文阅读

[人工智能]多元统计分析及R语言建模(第四版)--第四章多元相关与回归分析及R使用

1.一家保险公司想了解其总公司营业部加班时间与签发的新保单数目之间的关系,经过10周时间,收集了每周加班工作时间y(小时)和签发的新保单数目x(张)。

ee4.1=read.table("clipboard",header = T)
ee4.1
plot(ee4.1,main = '散点图', xlab = '保险单数',ylab = '工作时间')
cor(ee4.1)
lm4.1 <- lm(ee4.1)
lm4.1
square_sigma <- t(e4.1)/(10-1-1)
square_sigma
y = c(3.5,1,4,2,1,3,4.5,1.5,3,5)
x = c(825,215,1070,550,480,920,1350,325,670,1215)
y_hat <- 46.15 + 251.17*y
s <- t(y_hat - x)%*%(y_hat - x)/(10-1-1)
s
(summary(lm4.1) $ s)^2
SR <- t(y_hat - mean(x))%*%(y_hat - mean(x))
ST <- t(x - mean(x))%*%(x - mean(x))
s_R <- SR/ST
s_R
(summary(lm4.1) $ r.squared)
anova(lm4.1)
res <- residuals(lm4.1)
res
plot(y,res,main='残差散点图',xlab='每周签发的新保单数目',ylab='残差')
plot(lm4.1)
lm4.1_1 <- lm(x ~ y,data = ee4.1)
predict(lm4.1_1,newdata = data.frame(y = 1000))
lm4.1_1 <- lm(y ~ x,data = ee4.1)
predict(lm4.1_1,newdata = data.frame(x = 1000))

(1)绘制散点图,并以此判断x与y之间是否大致呈线性关系。

(2)计算x与y的相关系数。

(3)用最小二乘估计法求回归方程。

x = 251.17y?+ 46.15

(4)求随机误差ε的方差σ^2的估计值。

(5)计算x与y的决定系数。?

?

?(6)对回归方程作方差分析。

P<0.05,x与y间存在直线回归关系?。

(7)对回归方程作残差图并做一些分析。

?

(8)计算x0 = 1000(张)需要的加班时间是多少??

?

2.某家房地产公司的总裁想了解为什么公司中的某些分公司比其他公司表现出色,他认为决定总年销售额(以百万元计)的关键因素是广告预算(以千元计)和销售代理的数目。为了分析这种情况,他抽取了8家公司作为样本。

(1)做回归模型并解释各系数

多元线性方程:y = -22.75 + 0.1511 x1 + 1.2166?x2?

标准化偏回归系数为
x1:0.4741293

x2:0.3300133
由标准化偏回归系数可见,广告预算和销售代理的数目对年销售额的线性影响还是挺大的

(2)在5%的显著水平下确定每一解释变量与依赖变量是否呈线性关系

H0:x与y没有显著的线性关系.

?

P=>0.05,说明x与y没有显著的线性关系

(3)计算简单相关系数和复相关系数

3.学校毕业生起始工资的变化是否能用学生的平均成绩点数(GPA)和毕业时的年龄来解释。

e4.3 = read.table("clipboard",header = T)
e4.3
(lm4.3 = lm(起始工资~ GPA + 年龄,data = e4.3))
summary(lm4.3)
R4.3 = summary(lm4.3) $ r.sq
R4.3
R_2_4.3 = sqrt(R4.3)
R_2_4.3
predict(lm4.3,newdata = data.frame(GPA = 3,年龄 = 24))

(1)试做回归模型并解释各系数。

?

起始工资 = -5213.1 + 8508.8 GPA + 181.6?

(2)确定学生的GPA和年龄是否能真正用来解释起始工资样本的变化。

(3)预测某GPA为3.00,年龄为24岁的毕业生的起始工资。

4.研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系。

(1)计算y,x1,x2,x3的相关系数矩阵并绘制矩阵散点图。

(2)求y关于x1,x2,x3的多元线性回归方程。

得到y = -348.280+3.754x1+7.101x2+12.447X3

(3)对所求得的方程做拟合优度检验

?

R^2=Multiple R-squared=0.8055接近1,说明回归方程拟合度高。

?

R^2=Multiple R-squared=0.8055接近1,说明回归方程拟合度高。

?

R=0.8975>R0.05(8)=0.632,所以接受原假设,说明x与y有显著的线性关系

(4)对回归方程做显著性检验,对每一个回归系数做显著性检验

H0:x与y有显著的线性关系。

?

P=<0.05,说明x与y有显著的线性关系

(5)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再做回归方程的显著性检验和回归系数的显著性检验。

?

P3=0.2835最大,剔除x3,建立新的回归方程。

?

重新建立回归方程y=-459.624+4.676x1+8.971x2 对新的回归方程做显著性检验。 提出原假设H0=β1=β2=0。

?

P=<0.05,说明x与y有显著的线性关系

?

?

P1=<0.05,说明x1对y有显著的影响;

P2=<0.05,说明x2对y有显著的影响。

(6)使用逐步回归分析的逐步筛选方法获得一个最优的回归模型。

?

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-26 08:51:52  更:2021-11-26 08:52:43 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 4:12:09-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码