IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 京东用户行为分析 -> 正文阅读

[大数据]京东用户行为分析

京东用户行为分析

  • 项目背景

京东作为传统电商巨头,京东商城与京东物流的发展相得益彰,然而各种新兴的电商模式,带来了千人千面的购物方式和电商平台更加激烈的竞争,电商平台---发展初期的粗放式经营也转向了利用大数据和算法,基于用户行为,实现精细化营销。在这样的背景下,本文基于京东平台的部分数据进行了用户行为分析。

本次分析的目的主要是从数据中探索以下问题,得出结论,并提供一些可行性的建议:

  1. 分析用户在使用App整个过程中的特点,从获客,激活,留存,营收等方面,寻找可以优化的点
  2. 对用户购买行为进行分析,找出用户行为转化中存在的问题,最受欢迎的商品,找到针对用户运营和商品推荐的方向
  3. 进行用户价值分析,对用户进行分层,采用更有针对性的营销

  • 分析框架

数据集介绍

原始数据为京东竞赛数据集,数据集共有五个列表文件,包含了“2018-02-01”至“2018-04-15”之间在京东平台的用户行为数据,评论数据,商品数据,商家店铺数据以及用户数据

在本次分析过程中,需要用到的用户行为数据,商品数据,以及用户数据,原始数据集中行为数据列表过大,故截取了2018-04-01”至“2018-04-15”的数据,对用户行为数据集进行清洗:

jdata_action:
user_id
用户唯一标识
sku_id
商品唯一标识
action_time
行为时间
数据清洗时拆分成date,hour,weekday
type

1.pv? 2.pay? 3.fav? 4.comm? 5.cart

jdata_product:

sku_id

商品唯一标识

brand

品牌名

shop_id

店铺id

cate

品类

market_time

商品上市时间

jdata_user:

User_id

用户唯一标识

Age

年龄,-1表示未知,数字越大,年龄越大

Sex

性别? 0:男 ?1:女 ?2: 保密

User_reg_tm

注册时间

User_lv_cd

会员级别,数字越大,级别越高

City_level

城市等级,常用收货地址,数字越大,等级越高

Province

省份

City

城市

County

分析框架

?

  • 分析过程

(一)基于平台运营流程的AARRR模型分析

(1)每日新增uv

由于数据截取,前面几天老客数据不能完全计算,数据会有偏差,可以看出后面几天日新增uv基本稳定在30%左右。

(2)用户在不同时间维度下的活跃情况

?

日期维度下,pv和uv比较平稳,4.1—4.9日小幅波动,4.10开始递减,推测数据波动是由小规模营销活动产生。

星期维度下,pv和uv无明显波动,周日到周一周二的日均pv和uv略高,周五的pv相较于uv增加得更多,说明周末开始用户有更多的点击行为,这也可以为每周活动运营做一个参考,即每周活动可以放在周五晚开始,利用周末用户更多的浏览时间,并在周日晚上加大活动力度或是限时促销活动,促进销量。

小时维度下,pv和uv波动较大,在凌晨呈下降趋势,在凌晨3-4点达到最低,随后不断上升,在上午10点左右有一个小高峰,晚上19点之前pv和uv都比较平稳,晚上19—22点这段时间,用户访问行为达到最高峰。因此上午8-10点,晚上19-22点是各类活动运营非常关键的时间段,凌晨1-4点适合作为系统维护时间。

(3)留存率分析

由于截取的是部分时间数据,前两天的留存率会相对较高,但从总体看,用户留存率基本维持在10%--20%。根据Facebook的40-20-10法则,在所考察的时间范围内,平台的留存率低于标准,但留存率递减较慢,说明平台的用户依赖性较高,但同时也可以通过一些运营策略来提高平台的留存率:

通过活动刺激,引导新用户产生关键行为,如新人福利,减免卡券,每日签到等。引导客户熟悉会员体系与积分体系,优化用户使用流程,让用户在初次接触平台时能产生较好的用户体验,从而提高用户粘性。

(4)营收情况分析

因为数据中缺少付费金额,所以用付费次数代替,从上图可知,在所考察的时间周期,86%的用户只有一次购买行为,9%的用户有两次购买行为,每日的ARPPU约为1.1,绝大部分付费用户的购买次数相对比较低,复购率为0.1316。

(二)用户购买行为分析

(1)when用户在什么时间购买?

??

每日的付费用户数大约占总独立访客数的30%,星期维度下,周六周日的付费用户数占比略高。

小时维度下,用户的购买行为在上午10点和晚上22点达到两个峰值,相对于pv来说,在上午10点付费用户更多,晚上总体pv非常高,但付费用户数略低于上午10点,说明晚上用户浏览平台,有部分是“逛京东”,实际转化率相对较低,因此上午10点左右,注重商品的精准推荐,通过优惠券,限时折扣活动,促进付费转化,晚上19—22点,注重商品多样化推荐,提高用户“逛京东”的体验,同时设置限时秒杀活动,即时促进转化率。?

(2)who购买次数前200的用户画像

从四个维度进行分析:年龄(等级数字越大,年龄越大),性别,城市等级(数字越大,城市等级越高),会员等级(数字越大,会员等级越高)

消费次数排名前200位的用户中:

年龄方面,主要是年龄等级比较大的用户,这类用户相对来说,收入水平较高,购买力较强

性别方面,男性用户略多于女性用户,细分来看,年龄等级稍高,中年人群体中,女性用户较多,而在年龄等级较低的用户中,男性用户,明显多于女性用户

会员等级方面,消费较多的是等级较高的的用户,其中等级较高的男性用户数相对更多

城市等级方面,主要是城市等级中等的,注意到城市等级最低的用户数也比较多

从以上分析,可以重点关系以下几类用户

①等级较高,年龄较大的用户;

②中年女性用户;

③城市等级较低的用户;

④年龄等级较低的男性用户

(3)what用户浏览最多的产品,用户购买最多的产品

浏览量Top10品类 ????????????????????????????????????????????????????????????

????

购买量Top10品类

数据集中,品类数为80,平台覆盖的品类非常丰富,浏览量和购买量Top10的品类基本重合,说明这10大品类确实是用户最关注,最主要的消费品类,因此在做选品方面需要优先涉及到这10大品类。

进一步分析浏览量和购买量较高的商品及其所属品类:?

浏览量Top10的商品及其所属的品类 ???

?

购买量Top10的商品及其所属的品类

?? ?

浏览量前10的商品中,品类7有5件商品,只有224207这件商品购买量排在前10,品类34有3件商品排在前10,但是没有购买量占前10的商品。

购买量前10的商品所属的品类相对分散,说明每个品类都有其热销款,品类27有3款商品的购买量都排在前10,而且购买转化率比较高

浏览量前10的商品中,有6件商品的购买转化率为0%,可进一步分析原因:系统数据异常,产品价格,产品详情页,是否缺货导致。对于品类7可以对比分析购买量排在前10的商品和其他几个转化率为0的商品。

(4)how购买行为转化漏斗

??

在所考察的时间周期内,浏览—购买的转化率为21.55%,浏览—加入购物车—购买的转化率为17.27%,直接购买转化率较高,说明用户倾向于使用较为简单的购买方式

浏览—加入购物车—购买这一路径中,加入购物车—购买的转化率为60%,相对较高,说明用户对于加入购物车的商品购买意向比较高,此时可以通过消息提醒,以及推出限时优惠券,提高购物车商品的转化率

浏览—收藏—购买这一路径中,浏览—收藏转化率非常低,仅为3.32%。结合App页面进行分析,可能原因是:1.收藏功能是用形状表示的,而非文字,不容易引起用户的注意,这一功能的使用率就比较低;2.收藏的商品后期查看也没有购物车功能方便,由于这部分的分析没有相关的数据支撑,无法得出准确的结论,可以通过设计问卷进行调查,从而进行系统的优化

浏览—收藏—购买这一路径中,收藏—购买转化率为48%,近一半加入购物车的用户会付费购买,说明提高收藏功能的使用,有助于提高付费率,因此可以优化收藏功能的展示,以及收藏功能查看商品信息的优化,提升用户体验,促进付费

(三)用户价值分层RFM模型分析

根据最近一次消费时间间隔和消费频次,对其赋分,以其平均值作为参考线,可以将用户分为四类:

第I象限:最近一次消费时间与消费频次都为高分,该类用户近期有消费,且消费频率较高,属于高价值用户,对这类用户可以提供更多的会员活动以及VIP专属活动,提升用户被平台重视的体验感。

第II象限:最近一次消费时间得分低,消费频次得分较高,该类用户购买频次较高,但是最近一次购买的间隔时间比较长,存在用户流失的风险,对这类用户需要采取活动短信推送,客户端push提醒用户,并通过分析用户对产品的核心诉求与行为特征,有针对性地策划营销活动促进用户找回,并在找回后做好维护。

第III象限,最近一次消费时间与消费频次都为低分,该类用户近期无消费,且消费频次较低,属于机会用户,其价值有待挖掘,可以先根据用户画像,评估用户价值与成本,对于潜在价值较高的用户,向其推出一些试用活动以及优惠券,提升活跃度,培养平台购物习惯。?

第IV象限,最近一次消费时间得分高,消费频次得分低,该类用户最近有消费,但消费频次较低,属于需要深耕的用户,在用户购买行为后,做好售后服务,提升用户体验,并及时推送用户浏览量较高的商品,促进其复购。

  • 结论与建议

1.用户在一天中,上午10点,晚上21-22点最为活跃,也是购买的两个高峰时间段,其中上午10点付费人数更多,晚上21-22点,相对于浏览量,转化率较低部分用户的行为是“逛”。对于上午10点左右的活跃用户,进行商品的精准推荐,限时降价活动,简化付费流程。对于晚上19—22点之间活跃的用户,进行多样化的商品推荐,提升用户“逛”的体验,并通过拼团促销,直播种草活动,让用户更多地将心仪商品加入购物车或收藏。

2.用户的次日留存量为20%左右,相对较低,但递减较慢,用户对于平台依赖性较强,平台发展比较稳定,可以通过会员体系,积分活动提升用户对平台的信任,并通过每日签到,会员不定期优惠活动,提高用户活跃度与留存率

3.86%的用户付费次数仅为1次,复购率0.1316,付费用户中,仅有13.16%的用户有复购行为,用户复购率低,考虑有考察周期较短的,部分用户的复购行为不在所考察的时间周期,但每天付费用户的消费次数也仅为1.1-1.2次,更多的还是用户本身复购行为较少,从用户留存率偏低也可以得到验证。

留存是复购的基础,因此可以参考提高留存率的方法,另外还可以从以下方面进行分析:产品质量,服务质量(包装,物流,售后),产品体验,这些可以从商品评论以及客服反馈得到相关数据。还可以通过问卷调研,产品试用等方式交叉排查。利用假设检验方法,提出问题,并通过数据验证,得出引起复购率低的原因,再针对性解决

4.购买次数前200名用户中,男性用户占比较高,会员等级较高的用户占比较高,需要重点关注:①等级较高,年龄较大的用户购买力高,是重要的价值用户,可以对这类用户做好针对于会员的专属活动,进一步加强用户忠实程度;②中年女性关注商品质量,同时也关注价格,可以根据用户搜索和浏览行为,精准推荐用户青睐的商品,并适时推出折扣活动;③城市等级较低的用户,消费水平相对较低,对于价格比较敏感,对这类用户,拼团活动,限时秒杀等促销活动,可以较好地促进其消费;④年龄等级较低的男性用户,这类用户一般对某品类商品有偏好,同时价格敏感度较低,有冲动消费倾向,对于这类用户,精准推荐商品,并做好详情页的展示,以及简化付费流程。

5.浏览量和购买量最高的商品品类7,34,27,81,69,75,34,20,56,其中品类7的商品浏览量最高,但浏览购买转化率很低,仅为2.3%,还有部分商品转化率为0, 需要进一步分析原因,购买量前10的商品所属的品类较为分散,说明每个品类中都有其畅销款,用户的需求也比较分散。

因此,在选品时,优先考虑浏览和购买排名前10的品类,并分析转化率较低的品类下商品,找到转化率低的原因

6.用户浏览商品后,,直接购买转化率最高,加入购物车多于收藏,而加入购物车后,购买转化率60%,收藏购买转化率48%,相对比较高,而通过浏览—收藏—加入购物车—购买这一路紧转化率最低,说明有消费意愿的用户,更倾向较为简单的购买流程。另外,收藏功能的使用率较低,可以通过问卷调研方式了解原因,并有针对性地进行优化。

7.根据最近一次消费时间间隔,对于近期很长时间未消费的潜在流失用户,通过短信或客户端push方式进行召回,并策划与用户特征相匹配的活动,提升用户与平台的黏性,根据消费频次,对于消费频次较低的用户,可以通过发放试用权益,优惠券等方式,提高用户的活跃度,培养其在平台购物的习惯;对于近期有消费且频次较高的高价值用户,推出VIP活动。对于所有用户,都可以在有重要的日期,如用户生日,会员日等,发送消息或专属优惠活动,用户关怀对于不同层级的用户都有一定的提升用户对平台的信任,增强黏性的作用,留存是用户购买的基础,留住用户,再在关键时间节点推出对应的运营活动,提高用户购买转化率。

sql代码:GitHub - 132101020/-?

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-09-24 10:37:42  更:2021-09-24 10:39:45 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 23:36:30-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码