IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> 《十周成为数据分析师》笔记——业务线 第二节 如何像数据分析师一样思考 -> 正文阅读

[数据结构与算法]《十周成为数据分析师》笔记——业务线 第二节 如何像数据分析师一样思考

1、互联网数据分析的基本思路

找出问题→分析问题→解决问题
在这里插入图片描述

2、不同类型数据分析方法及原理

(1)描述性分析
通过计算数据的集中性特征和波动性特征以了解数据的基本情况。

  • 数值分析:数量、平均数、极差、标准差、方差、极值

  • 分布规律:均匀分布、正态分布、长尾分布
    在这里插入图片描述

  • 可视化方法:柱状图、条形图、散点图、饼状图……
    (2)诊断性分析
    深入挖掘问题根源,识别依赖关系,找出影响因子。

  • 关联分析
    热力图
    在这里插入图片描述
    正相关、零相关、负相关
    在这里插入图片描述

  • 相关系数
    皮尔逊相关系数(只适用于线性关联):在这里插入图片描述
    (3)预测性分析
    使用线性回归或逻辑回归的方法找到自变量与因变量之间的关系,并使用该关系等式预测因变量的变化。
    在这里插入图片描述

  • 线性回归
    ①估算系数(最小二乘法)
    在这里插入图片描述
    ②评估模型的准确性—— R 2 ? R^{2}\, R2在这里插入图片描述
    R 2 ? R^{2}\, R2含义:Y中出现的变化可以被X解释的比例。
    例如:
    在这里插入图片描述
    F:远大于0,表明系数不为0,Y与自变量一定有关联。F用于检验总体自变量与因变量之间的关系。 F不为0说明有系数不为0 。
    t=0表示单个自变量与因变量间没有关系。
    t值越大,P值越接近0时,越显著,系数越有效

  • 逻辑回归
    在这里插入图片描述
    因变量的取值范围由线性回归的[?∞,+∞]转变为[0,1]。
    ①极大似然估计
    已知某些观测所得到的结果时,对观测结果所属的概率分布参数进行估值。
    在这里插入图片描述
    ②估算系数与多元逻辑回归
    使用似然函数的数学公式估算参数:在这里插入图片描述
    多元逻辑回归模型:在这里插入图片描述
    (4)仿真模拟
    利用数学仿真来模拟各种条件下产生的结果。

3、不同类型的数据分析方法的Excel实践(2016)

(1)描述性分析

  • 数值分析
    平均数AVERAGE
    最大值MAX
    最小值MIN
    标准差STDEV.P
    极差MAX-MIN
  • 直方图
    选中两列数据→插入→推荐的图表→所有的图表→直方图(第二个排列图)
    可用于二八分布(帕累托分析):20%的地区占80%的市场。
  • 折线图
    选中数据→插入→推荐的图表→所有的图表→折线图(右键可添加趋势线、数据标签等)
  • 气泡图
    选中三个维度的数据→插入→推荐的图表→所有的图表→XY散点图(倒数第二个,气泡图)
    可通过增加颜色,展现4个维度的数据。
    (2)诊断性分析
  • 关联分析
    PEARSON、CORREL
    大于0表明存在正相关关系
  • 线性回归
    数据→数据分析→回归→确定→Y值列、X值列选定(包含变量名)、勾选标志→确定
    <注意先看P值是否显著,是否有效>
  • 仿真模拟
    利用随机数

4、数据可视化的基本原则

(1)图表类型选择

  • 柱状图——比较数据大小
  • 散点图——表示数据关系
  • 气泡图——观察多指标间的关系
  • 折线图——观察时间序列数据(可添加趋势线预测未来趋势)
  • 雷达图——展现多维数据
  • 漏斗图——分析数据转化(广告分析、流量分析)
    (2)坐标轴、颜色、图表细节优化
  • 坐标轴范围要包含数据本身
  • 使用红色标注强调内容
  • 刻度线、数据标签等细节优化
    (3)数据维度展现
  • 一维数据
    一维数据指的是只有单一属性的数据,比如客单价销量销售额等,一维数据一般单纯用在数值比较趋势分析上,优点是直观简洁,缺点是信息量有限。在这里插入图片描述
  • 二维数据
    二维数据指的是拥有两个属性的数据,比如地区+订单量时间+订单额等,二维数据很多被用在比较和分析两种不同属性的关联度上,优点是组合方式多、使用面广,缺点是无论怎么组合分析,都会产生信息遗漏。在这里插入图片描述
  • 三维数据
    三维数据指的是拥有三个属性的数据,比如四象限分析法,三维数据是用于分析多属性对象的,优点是信息量大、结论清晰,缺点是对于细节仍无法面面俱到。<基本判断,逻辑分析>在这里插入图片描述
  • 多维数据
    多维数据指的是拥有多个属性的数据,比如添加颜色属性后的四象限分析法,多维数据可以用于分析任何复杂的运营问题,优点是信息完整面面俱到,缺点是数据分析手段复杂,需要较高的数据分析能力。在这里插入图片描述
  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2021-08-14 14:21:25  更:2021-08-14 14:24:07 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/25 20:55:17-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码