目录
0. 相关文章链接
1. 什么是组合标签计算
2. 应用场景
3. 数据计算
注:此博文为根据 赵宏田 老师的 用户画像·方法论与工程化解决方案 一书读后笔记而来,仅供学习使用
0. 相关文章链接
用户画像文章汇总
1. 什么是组合标签计算
组合标签计算是画像开发中的一个重要模块。当业务方根据业务规则应用标签时,是需要组合多个标签来创建对应的用户群体的,此时需要 应用到组合标签计算。
2. 应用场景
????????这里看一个组合标签计算的应用场景,在如下图中用户A、B、C、 D、E已经被打上了符合自己特征的标签,业务人员想给“高价值用户 群组”发放一批优惠券促使他们消费。根据运营经验,定义了 “高价 值用户群组”的特征为:①女性用户;②25?35岁之间;③累计消费5 次以上;④累计消费500元以上;⑤活跃度在中活跃以上的用户。可以 看到同时满足这些条件的用户为用户B、用户C、用户E。组合标签计算 的任务就是根据业务人员筛选的规则,计算出符合对应条件的用户 群。
组合标签计算的实现逻辑,总结来说分为3个过程:
- 读取不同组合标签的计算规则;
- 将人群规则拼接成接口传入参数的查询命令,通过接口方式进行查询;
- 接口查询计算时,通过Elasticsearch查询符合这些条件的用户id,返回用户id作为rowkey去HBase中查询这些用户身上的标签信息。
3. 数据计算
????????业务人员在画像产品端可以组合标签圈定人群(如下图),对应地在关系数据库中将会记录该条人群规则包含的用户标签。
记录圈定人群规则的表中主要包括以下主要内容(如下图): ??? ?人群id:创建该条人群规则对应的唯一id标识。 ??? ?人群名称:该条人群规则在业务定义上的名称。 ??? ?人群规则:人群组合标签规则中包含的标签及标签值。 ??? ?人群数量:该人群对应的数量。 ??? ?创建时间:该人群规则的首次创建时间。 ??? ?修改时间:该人群规则的最近一次修改时间。 ??? ?是否应用:该人群是否应用到线上。
????????在调用接口查询时,将人群规则拼接成字符串,通过Elasticsearch查询符合该规则的用户id。例如针对上面id 为“100003”的人群,将其规则拼接成“ATTRITUBE_U_06_001,6||ACTI0N_U_05_003,3||C0NSUME_U_05_003,15”,柞为参数传入接 口地址。 ????????本博文介绍了一种组合标签计算用户人群的解决方案,总结来说包 括两个过程:首先从关系库表中(如MySQL)读取业务人员圈定人群的 规则,将人群规则拼接成接口的传入参数,然后通过接口请求 Elasticsearch的方式查询对应的用户id。
注:再次声明,此博文为根据?赵宏田?老师的?用户画像·方法论与工程化解决方案?一书读后笔记而来,仅供学习使用
注:其他相关文章链接由此进 ->?用户画像文章汇总
|