IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Profile_Day05:企业级360全方位用户画像 -> 正文阅读

[大数据]Profile_Day05:企业级360全方位用户画像

Profile_Day05:企业级360全方位用户画像

1昨日内容回顾

主要讲解2个方面的内容: 如何基于SparkSQL实现自定义外部数据源HBase和统计类型标签模型开发.
1, SparkSQL外部数据源HBase
按照SparkSQL模块提供的外部数据源接口,实现HBase表中加载和保存数据
```shell

在这里插入图片描述

2,今日课程内容提纲

3,用户画像:标签系统

整个用户画像项目:基于电商平台构建的,主要使用注册会员的基本信息,交易数据和流量数据对用户进行把标签
用户画像:将用户数据进行标签化

  • 模块一:标签管理平台WEB Platform ,管理这个标签,创建,删除,修改标签和执行标签应用程序
    每个标签对应一个模型,每个模型就是一个Spark Application应用程序
    讲解项目时:适用简易版,基于SpringBoot+Vue.js开发
    标签分类:可以按照不同的角度分类
    • 分类一:人口属性,商业属性,行为属性和用户价值
    • 分类二:级别
      • 主分类标签:1级,2级,3级
      • 4级标签:业务标签,比如性别标签,职业标签
      • 5级标签: 属性标签,就是4级标签对应的值,比如性别标签对应2个属性值
  • 模块二:标签模型开发,针对每个标签开发应用程序
    每个标签开发一个Spark Application应用程序,后台使用OozieJava API调度执行标签模型,给每个用户打上标签.
    标签分为三种类型:规则匹配类型标签(Rule Match),统计类型标签(Statistics)和挖掘(ML)类型标签

每个标签模型开发的流程

  • 第一步,确定标签(数据源,属性值:属性标签)
  • 第三步,开打标签模型,编写Spark Application应用程序
  • 第四步,标签模型测试
  • 第五步,上线运行及AB测试
  • 第六步,标签优化及重新开发

已性别标签模型为例,开发标签模型应用程序

  • 创建4级业务标签:其中规则rule字段包含,此标签计算时数据源信息(在mysql文件中)

在这里插入图片描述

  • 创建5级属性标签:其中规则rule字段辅助给用户打上标签

在这里插入图片描述

开发标签模型基类,使用模板方法设计模式:AbstractModel,其中executeModel模板方法,确定基本方法执行顺序.
在这里插入图片描述

每个标签模型继承基类:AbstractModel,实现其中doTag方法,既可以给每个用户打上标签

2种类型标签模型开发:规则匹配类型标签和统计类型标签

1 职业标签JobTagModel
2 	给每个用户打上职业标签,属于规则匹配类型标签

5 推荐模型案例: 构建电影推荐

(一),基于RDD构建ALS推荐模型

(二),基于DataFeame构建ALS推荐模型

附录:创建Maven模块

1) ,Maven工程结构

2),POM文件内容

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-11-28 11:22:04  更:2021-11-28 11:24:01 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 7:52:58-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码