多元统计分析及R语言建模
引言:
1.真正结合数据和创造力,需要掌握数据分析与统计建模工具。 理论+实践; 定性+定量; 资料获取:Rstat.leanote.com
第1章 多元统计分析的概述
1.1 多元统计分析简介
1.2 多元统计分析用途
1.变量之间的相依性的分析: 研究变量之间的相互关系 2.构造预测模型,进行预报控制: 比如构造回归模型来进行预测,进一步进行估计,控制。 3.进行数值分类,构造分类模式 4.简化系统结构,探讨系统内核
😁重点在于:如何选择适合的方法来解决实际问题,需要对问题进行综合考虑。
1.3 多元统计分析内容
1.多元数据的数学表示 2.多元数据的直观分析:通过图示的方法显示数据,即是多元数据的可视化。 3.多元线性相关分析:研究数据之间有没有线性关系 4.多元线性回归分析:在多元线性相关分析基础上,数据之间有相关关系,就用回归分析表示出来。 5.广义和一般线性模型:对多元线性回归分析模型的推广,分成广义和一般线性模型。 6.判别分析:传统的多元统计分析方法。对所研究的对象进行判别分类。要求事先归类,对新的对象判断是哪一类。 7.聚类分析:事先不需要归类,对多变量(多元)的数据进行统计分析。比如计算我们国家31个地区的居民消费,经济发展,就用聚类分析方法研究多变量字节的分类问题。 8.主成分分析:数学技术,变量变化,压缩。把多变量数据(多维的)压缩成一维的,平面上展示。 9.因子分析:主成分分析的推广,给压缩后的数据经济学上或者统计学上的实际意义,表示主成分代表什么。 10.对应分析:因子分析的推广,把R型因子分析,和Q型因子分析,即把样品的因子分析和变量的因子分析合成一个来研究样品和变量之间的关系。 11.典型相关分析:多元线性相关分析的推广。自变量和因变量都是多组的。 12.多维标度法 13.综合评价法
1.4 统计软件及其应用
😁强大的统计分析软件
-
SAS: 三大著名分析软件之一, 组合比较困难, 入门比较困难 -
SPSS: 操作简单 无需编程 有翻边的数据接口 灵活的功能模块组合 -
3 .S-PLUS:操作界面简单 全面的统计模型和分析手段 很强的图形处理能力 兼容性极好
🙄完整的数值计算软件
MATLAB:
- ? 数值分析
- ? 数值和符号计算
- ? 工程与科学绘图
- ? 控制系统的设计与模仿
- ? 数字图像处理技术
- ? 数字信号处理技术
- ? 通讯系统设计与仿真
- ? 财务与金融工程
1.5 R语言及系统设置
😁免费的数据分析软件
R:
1.优点:自由软件,统计功能强大,可以看做是Splus的免费版本,是统计研究的首选 2.缺点:初学较为麻烦,需要有一一定的编程经验
1.6 R语言包及其使用
01 关于R语言1.R语言是一种为统计计算和图形显示而设计的语言环境,是贝尔实验室开发的S语言的一种实现,可以看成S++,提供了一系列统计的图形显示工具
2.R预言师属于CNU系统的一个自由,免费,源代码开放的软件,是一个用于统计计算和统计制图的1优秀工具
02 R语言软件的下载与安装
03 R语言包及其函数
R语言标准包:标准(基本)包构成R源代码的一个重要部分。他们包括允许R工作的基本函数和数据集,标准统计和图形工具。
04 R语言扩展包
|