IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 大数据之hive 基础查询 -> 正文阅读

[大数据]大数据之hive 基础查询

/*电商项目基础查询
温馨提示:本任务使用的云试验平台为上课时所用,非电商项目实验平台,数据库名 kaikeba
先使用 desc 表名;语句查看字段,在进行查询。

  1. 激活天数距今超过 500 天的男女分布情况(使用 user_info)(使用 user_info 表)
  2. 不同性别、教育程度的用户分布情况(使用 user_info) (使用 user_info 表)
  3. 2019 年前 4 个月中,全天各个时间段的不同品类购买金额分布(24 小时制,使用 user_trade 表)
  4. 统计在 2018 年购买的商品品类在两个以上的用户数(使用 user_trade 表)*/

– 1. 激活天数距今超过 500 天的男女分布情况(使用 user_info)(使用 user_info 表)
/*
1.现将激活天数计算
2.再将性别分段
3.根据性别分段统计用户个数
/
select sex,count(distinct user_id)
from user_info
where datediff(current_date,to_date(firstactivetime))>500
group by sex;
– 2. 不同性别、教育程度的用户分布情况(使用 user_info) (使用 user_info 表)
/

1.将性别和教育程度分段
2.在统计各个分段的用户数
get_json_object(string json_string, string path)
解析json字符串的一个字段
第一个参数填写json对象变量,第二个参数使用$表示json变量标识,
然后用 . 或 [] 读取对象或数组;如果输入的json字符串无效,那么返回NULL。
每次只能返回一个数据项。
*/

select sex,get_json_object(extra1,’ . e d u c a t i o n ′ ) , c o u n t ( d i s t i n c t u s e r i d ) f r o m u s e r i n f o g r o u p b y s e x , g e t j s o n o b j e c t ( e x t r a 1 , ′ .education'), count(distinct user_id) from user_info group by sex,get_json_object(extra1,' .education),count(distinctuseri?d)fromuseri?nfogroupbysex,getj?sono?bject(extra1,.education’);
– 方法二
select sex,extra2[‘education’],count(user_id)
from user_info
group by sex,extra2[‘education’];

– 3. 2019 年前 4 个月中,全天各个时间段的不同品类购买金额分布(24 小时制,使用 user_trade 表)
/*
substr(string A,int startindex,intlen),
1.先将将2019年的前4个月限定条件
2.再将不同购买品类分段
3.统计不同品类的购买金额
字符串的截取,如果不指定len,则从起始位置截取到最后。
*/
select substr(from_unixtime(pay_time,‘yyyy-MM-dd hh’),12),goods_category,sum(pay_amount)
from user_trade
where dt between ‘2019-01’ and ‘2019-04’
group by substr(from_unixtime(pay_time,‘yyyy-MM-dd hh’),12),goods_category;

– 4. 统计在 2018 年购买的商品品类在两个以上的用户数(使用 user_trade 表)
/*
1.先分析2018年的用户购买的商品种类,在统计种类大于2的用户
2.用子查询来统计购买商品种类大于2的所有用户数*/

select count(distinct a.user_name)
from(select user_name
from user_trade
where year(dt)=‘2018’
group by user_name
having count(distinct goods_category)>2
)a;

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-12 16:40:01  更:2021-08-12 16:42:08 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 9:56:49-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码