| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 商业数据的加工处理 -> 正文阅读 |
|
[人工智能]商业数据的加工处理 |
目录 商业数据的加工抽取数据源中的指定数据有时候我们导入的数据源并不是我们全部所需要的,我们只需要其中的部分数据,这样的情况下,我们可以从数据源中进行满足条件的数据抽取。
数据源的分类汇总(分组)分类汇总是对所有资料分类进行汇总。把资料进行数据化后,先按照某一标准进行分类,然后在分完类的基础上对各类别相关数据分别进行求和、求平均数、求个数、求最大值、求最小值等方法的汇总。 我们日常工作中经常接触到二维数据表格,我们经常需要根据表中某列数据字段对数据进行分类汇总。 数据分类汇总通常可以满足多种数据整理需求,如:
分类汇总是统计中常用的方法。比如统计学生成绩,及格不及格的归类,分优良中差等级归类等。 完善数据源在数据加工中,完善数据源的方式大致有:
透视列与逆透视列这是对互逆的过程。 逆透视列是将二维表转化为一维表,一维表便于系统进行数据处理和分析。 透视列是将一维表转化为二维表,二维表更符合人的观察习惯。 概念: 一维表:每列都是独立属性,列和列之间不能在归为一类概念。录入原始数据,一般要有一维表。 二维表:至少有部分列是非独立的,同类概念/属性/参数(可归类为一类),那么就是二维表。二 商业数据的整理与转换查询编辑器使用查询编辑器可连接到一个或多个数据源,调整和转换数据以满足自己的需要,然后将该模型加载到数据建模页面进行关系建模。 打开查询编辑器的方式有两种:
一旦查询编辑器与数据进行加载后,可以看到以下几个分区:
在查询编辑器中,可以实现:
数据排序和筛选排序方法有很多,可以按行、按列、升序、降序排序,也可以按颜色进行排序,有些时候我们也会多条件排序,比如先按地区,每个地区又从高到低排序等等。普通的排序,我们选中所要排序的列的某一个单元格, 点击右键,排序,选择要升序还是降序即可。第二种排序就是自定义排序,操作和普通排序是一样的,只是自定义排序可以选择多个条件。 筛选功能是非常的强大,可以单条件筛选,也可以多条件筛选,不同的格式筛选也会有不同的方法,例如:对日期的筛选我们可以筛选是介于某个时间段内、在某个时期之后的、或者是仅看某个月或者某个季度等等,像文本就是包含或者等于或者不等于某个字某个短语的,数字的就是更多了,等于、不等于、大于小于,大于等于等等。 两者的区别在于: 排序是为了将某列按照一定顺序(正序或者倒序)来排列。 筛选是为了将需要的值所在的行筛选出来。 数据源合并与转换数据合并是把在不同数据源的数据收集、整理、清洗并加工,然后转换后加载到一个新的数据源,为数据消费者提供统一数据视图的数据集成方式。 数据合并的重要性
数据合并的优点
格式和属性设置在数据整理和转换时,我们可以更改数据的类型,如整数型、文本型、日期型等;也可以按需更改数据的格式,如设置成百分比、科学计数、货币格式等。 创建和管理关系自动创建关系导入多个表时,很可能需要使用所有这些表中的数据来执行一些分析。为准确计算结果并在报表中显示正确信息,这些表之间创建关系是必需的。 数据分析与可视化软件一般都可以轻松创建这些关系或者进入软件后点击自动检测功能即可实现自动创建关系。事实上,在大多数情况下,无需执行任何操作,软件导入数据后会自动执行自动创建相关操作。但有时,可能需要自行创建关系,或者需要对关系进行更改。 手动创建关系创建关系:
默认情况下,软件为新关系自动配置“基数”(方向)、“交叉筛选方向”和“激活此关系”选项。但是,可根据需要更改这些设置。如果为该关系选择的表均不具有唯一值,则将看到以下错误:ONE OF THE COLUMNS MUST HAVEUNIQUE VALUES(其中一列必须具有唯一值)。关系中至少有一个表必须具有密钥值的不同的唯一列表,该列表是对所有关系数据库技术的常见要求。 如果遇到此错误,可采用以下方式修复:
手动编辑关系编辑关系:
配置其他选项创建或编辑关系时,可配置其他选项。默认情况下,软件会根据最佳推测自动配置其他选项,但每个关系的配置可能会根据列中的数据有所不同。 基数“基数”选项可以具有以下设置之一: 多对一(*:1):多对一关系是最常见的默认关系类型。这意味着一个给定表中的列可具有一个值的多个实例,而另一个相关表(通常称为查找表)仅具有一个值的一个实例。 一对一(1:1):在一对一关系中,一个表中的列仅具有特定值的一个实例,而另一个相关表也是如此。 一对多(1:*):在一对多关系中,一个表中的列仅具有特定值的一个实例,而另一个相关表可具有一个值的多个实例。 多对多(*:*):借助复合模型,可以在表之间建立多对多关系,从而消除了表中对唯一值的要求。它还删除了旧解决办法,如为建立关系而仅引入新表。 交叉筛选器方向“交叉筛选方向”选项可以具有以下设置之一: 双向:出于筛选目的,两个表被视为如同一个表。“双向”设置非常适用于其周围具有多个查找表的单个表。例如,具有部门查找表的实际销售额表。此配置通常称为星型架构配置(一个具有多个查找表的中心表)。但是,如果你拥有两个或多个具有查找表(部分查找表共有)的表,则“双向”设置不适合。继续讲之前的示例,在本例中你还一个预算销售表,它记录了每个部门的目标预算。并且,部门表格同时连接到标售表和预算表。对于此类配置,请避免“双向”设置。 单向:最常用的默认方向,这意味着连接表中的筛选选项适用于将求值总和的表。如果你在EXCEL2013 或更早的数据模型中导入了POWER PIVOT ,则所有关系都将具有单个方向。 激活此关系勾选后,关系会用作处于活动状态的默认关系。如果两个表格之间存在多个关系,则软件可通过活动关系自动创建包含这两个表的可视化效果。 数据建模数据建模概念数据建模其实就是识别表的类型和表的关系,并按照设计的需求来搭建关系。 原因:当面对庞大的数据源和各种报表时,一定要找一个切入点。这个切入点就是浏览各个表,然后对表进行分类。在建模的过程中,最主要的就是分清楚数据表(又叫事实表)和维度表(又叫LOOKUP表),在分清楚表的类型后,即可进行布局设计。一般都是维度表在上,数据表在下创建关系。
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 7:27:03- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |