| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> 5-网站日志分析案例项目回顾与点击流数据分析项目介绍 -> 正文阅读 |
|
[大数据]5-网站日志分析案例项目回顾与点击流数据分析项目介绍 |
文章目录5-网站日志分析案例项目回顾与点击流数据分析项目介绍参考: 一、网站日志流量数据分析1.背景:在互联网应用中,日志是非常重要的数据,因为互联网项目往往要求是7*24不间断运行的,所以能获取到监控系统运行的相关日志数据并进行分析就显得非常重要。网站流量统计是改进网站服务的重要手段之一,通过获取用户在网站的行为数据,进行分析,从而得到有价值的信息,并基于这些信息对网站进行改进。 2.日志种类①系统日志:开发人员在系统后台代码中增加的日志输出语句,如果是Java语言,通常采用log4j或slfj框架技术进行一些日志语句的输出,但这类输出信息并不全面,不能细致地把系统运行信息进行输出。 3.分析指标①PV(Page View) 4.日志流量数据分析系统二、点击流日志数据分析1.点击流和网站日志点击流(Click Stream)是指用户在网站上持续访问的轨迹。众所周知,用户对网站的每次访问包含了一系列的点击动作行为,这些点击行为数据就构成了点击流数据(Click Stream Data),它代表了用户浏览网站的整个流程。目前点击流数据的获取方法有很多,例如通过JS进行事件捕获、发布客户端应用进行采集、网站日志分析等等,本文仅以网站日志分析为例进行阐述。 点击流和网站日志是两个不同的概念,点击流是从用户的角度出发,注重用户浏览网站的整个流程;而网站日志是面向整个站点,它包含了用户行为数据、服务器响应数据等众多日志信息,我们通过对网站日志的分析可以获得用户的点击流数据。关于点击流数据更多系统的解释,推荐阅读《点击流数据仓库》一书。 点击流数据是网站运营分析的主要数据依据。基于用户的点击流数据可以进行诸如用户行为、用户忠诚度、用户价值、系统优化等一系列的分析。那么用户的点击流数据都包含哪些?我们该如何获得这些点击流数据呢?让我们先了解一下网站的构成以及用户访问网站的一些基本原理。首先,网站是由多个网页(Page)构成,当用户在访问多个网页时,网页与网页之间是靠Referrers参数来标识上级网页来源。由此,我们就可以确定网页被依次访问的顺序。其次,用户对网站的每次访问,可视作是一次会话(Session),在网站日志中将会用不同的Sessionid来唯一标识每次会话。通过Sessionid与Referrers的结合,我们就可以确定每个用户依次访问网站的网页顺序。如果把Page视为“点”的话,那么我们可以很容易的把Session描绘成一条“线”,也就是用户的点击流数据轨迹曲线。 2、点击流流程点击流:点击流(Click Stream)是指用户在网站上持续访问的轨迹,形成点击事件,它会记录用户浏览站点的整个过程。 3.原始数据样式:4.页面点击流模型Pageviews表session为一个用户,用户对网站的每次访问。 5.点击流模型Visits表(按session聚集的页面访问信息) 这就是点击流模型。当WEB日志转化成点击流数据的时候,很多网站分析度量的计算变得简单了,这就是点击流的“魔力”所在。基于点击流数据我们可以统计出许多常见的网站分析度量 三、如何进行数据分析网站数据分析整体来说是一个内涵非常丰富的体系,其整体过程是一个金字塔结构: 1.网站流量质量分析流量对于每个网站来说都是很重要,但流量并不是越多越好,应该更加看重流量的质量,换句话来说就是流量可以为我们带来多少收入 细分是指通过不同维度对指标进行分割,查看同一个指标在不同维度下的表现,进而找出有问题的那部分指标,对这部分指标进行优化。 3.网站内容及导航分析对于所有网站来说,页面都可以被划分为三个类别:
首页和列表页都是典型的导航页; 比如从内容导航分析中,以下两类行为就是网站运营者不希望看到的行为: 第一个问题:访问者从导航页进入,在还没有看到内容页面之前就从导航页离开网站,需要分析导航页造成访问者中途离开的原因。 4.网站转化及漏斗分析所谓转化,即网站业务流程中的一个封闭渠道,引导用户按照流程最终实现业务目标(比如商品成交);而漏斗模型则是指进入渠道的用户在各环节递进过程中逐渐流失的形象描述; 4.1 助力和流失
4.2迷失造成迷失的主要原因是转化流量设计不合理,访问者在特定阶段得不到需要的信息,并且不能根据现有的信息作出决策 四、流量分析常见指标1、常见指标课程中涉及的分析指标主要位于以下几大方面: 2、来源分析来源分类:提供不同来源形式(直接输入、搜索引擎、其他外部链接、站内来源)、不同来源项引入流量的比例情况。通过精确的量化数据,帮助用户分析什么类型的来路产生的流量多、效果好,进而合理优化推广方案。 五、整体技术架构流程
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/24 13:49:09- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |