IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> hive复杂类型数据详解—arraymapstruct -> 正文阅读

[大数据]hive复杂类型数据详解—arraymapstruct

array类型
1.数据访问

语法: A[n]
操作类型: A为array类型,n为int类型
说明:返回数组A中的第n个变量值,数组的起始下标为0

select score, score[0], score[1] from demo_class ;
1
[90,92] 90 92
[80,60] 80 60
[50,66] 50 66

2.size()函数可以查询数组中元素的个数,下标超过长度返回null 值

[90,92] 2 NULL
[80,60] 2 NULL
[50,66] 2 NULL

select score, size(score), score[3] from demo_class ;
1
3.array_contains()函数可以查询数组中是否包含某个元素

array_contains(数组名,值)
返回 true 或 false

select score, array_contains(score, 90) from demo_class;
1
[90,92] true
[80,60] false
[50,66] false

map类型
1.数据访问

语法: M[key]
操作类型: M为map类型,key为map中的key值
说明:返回map类型M中key值为指定值的value值

select result, result['math'], result['english'] from demo_class ;
1
{“math”:90,“english”:92} 90 92
{“math”:80,“english”:60} 80 60
{“math”:50,“english”:66} 50 66

2.获取map中的键、值

map_keys()
map_values()

select map_keys(result), map_values(result) from demo_class ;
1
[“math”,“english”] [90,92]
[“math”,“english”] [80,60]
[“math”,“english”] [50,66]

3.size()函数获取map中键值对的个数

select result, size(result) from demo_class ;
1
{“math”:90,“english”:92} 2
{“math”:80,“english”:60} 2
{“math”:50,“english”:66} 2

4.查询map中是否包含某个键、值

Hive复杂数据类型使用介绍
docx

5星
超过95%的资源
19KB

下载
array_contains(map_keys(字段名), 键名)
array_contains(map_values(字段名), 值名)

select result, array_contains(map_keys(result), 'math') from demo_class ;
select result, array_contains(map_values(result), 90) from demo_class ;
1
2
结果分别为

{“math”:90,“english”:92} true
{“math”:80,“english”:60} true
{“math”:50,“english”:66} true

{“math”:90,“english”:92} true
{“math”:80,“english”:60} false
{“math”:50,“english”:66} false

可以当做where 过滤条件,如选取所有result 值为90的数据

select * from demo_class where array_contains(map_values(result), 90) ;
1
struct类型
语法: S.x
操作类型: S为struct类型
说明:返回集合S中的x字段

select class, class.id, class.grade from demo_class ;
1
{“id”:1,“grade”:“genius”} 1 genius
{“id”:2,“grade”:“excellent”} 2 excellent
{“id”:3,“grade”:“fighting”} 3 fighting

五、与其他数据类型转换
将array和map转化为基本数据类型(行转列)
explode()

函数将一列array 或者map 结构拆分成多行

select explode(score) from demo_class ;
1
数据
[90,92]
[80,60]
[50,66]
变为
90
92
80
60
50
66
每一个数据单独成行

select explode(result) from demo_class ;
1
数据由
{“math”:90,“english”:92}
{“math”:80,“english”:60}
{“math”:50,“english”:66}
变为
math 90
english 92
math 80
english 60
math 50
english 66
key值和value值被分成两列,每一个键值对单独成行

explode 函数如果要和其他字段一起查询,则需借助lateral view 语句。lateral view首先为原始表的每行调用函数,函数会把一行拆分成一或者多行,lateral view再把结果组合,产生一个支持别名表的虚拟表

lateral view udtf(expression) tableAlias AS columnAlias

select name, score, score_e?
from demo_class?
lateral view explode(score) v as score_e ;
1
2
3
hive和oracle函数对照表.xlsx
xlsx

0星
超过10%的资源
18KB

下载


select name, result, result_key, result_value ?
from demo_class?
lateral view explode(result) v as result_key, result_value ;
1
2
3


基本数据类型转化为array、map(列转行)
1.转为array

collect_set()

函数接受基本数据类型,将某字段的值进行去重汇总,产生array类型的字段。一般需要配合group by一起使用,聚合非分组字段

collect_list() 函数作用同上,但是不去重

如将int 类型的字段score 转化为array 类型


select name, collect_set(score) from demo_score group by name ;
1
a [90,92]
b [80,60]
c [50,66]
w [70,56]

collect_set() 常与concat_ws() 连用,用于列转行,可以改变连接符号,但返回值是字符串string 类型

concat_ws(separator, [string | array(string)]+)

函数只接受字符串和数组类型,将字段和分隔符拼接为数组

select name, concat_ws('-', collect_set(class) ) ?from demo_score ?group by name ;
1
a math-english
b math-english
c math-english
w math-english

2.转为map

str_to_map() 函数将字符类型数据,转化成map格式的数据

str_to_map(text, delimiter1, delimiter2)

delimiter1 将文本分隔为键值对,delimiter2 用来分隔key 和value。如果没有指定分隔符,默认 delimiter1 为’,’ ,delimiter2 为’=’。

select str_to_map("math:90-english:92", "-", ":") ;?
1
{“english”:“92”,“math”:“90”}
————————————————
版权声明:本文为CSDN博主「吾岸WAN」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_40474941/article/details/123248779

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-08-06 10:50:33  更:2022-08-06 10:55:25 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/20 1:36:06-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码