| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> Hive复合数据类型、视图、函数、特殊分隔符 -> 正文阅读 |
|
[大数据]Hive复合数据类型、视图、函数、特殊分隔符 |
参考文章:https://www.cnblogs.com/qingyunzong/p/8746159.html 一、复合数据类型1、array:ARRAY<data_type>2、map:MAP<primitive_type, data_type>3、struct:STRUCT<col_name:data_type>现有数据如下:
建表语句:
导入数据:
查询显示后如下: 假若想查询address字段下的某个值,可以:
这样就只显示了字段下的某一个值: 4、union:UNIONTYPE<data_type,data_type,...>Union类型可以在同一时间点,保持恰好有一个指定的数据类型。可以使用create_union的UDF创建一个实例的类型:
在查询的结果中,第一部分对于union的反序列化来说是一个tag,让它知道union的哪个部分被使用。序号0,表示声明的第0个数据类型,即int,其他同理。 创建union,必须为create_union提供tag:
二、视图1、Hive的视图与关系型数据库的视图区别和关系型数据库一样,Hive也提供了视图的功能,不过存在以下区别: (1)只有逻辑视图,没有物化视图; (2)视图只能查询,不能load、insert、update、delete数据; (3)视图在创建的时候,只是保存了一份元数据,当查询视图的时候,才开始执行视图对应的那些子查询。 2、Hive视图的创建
3、Hive视图信息的查看
4、Hive视图的使用
5、Hive视图的删除
三、函数1、内置函数(1)查看内置函数
?(2)显示函数的详细信息
(3)显示函数的扩展信息
?2、自定义函数UDF? ? ? ? 详见:https://www.cnblogs.com/qingyunzong/p/8746159.html 当 Hive 提供的内置函数无法满足业务处理需要时,此时就可以考虑使用用户自定义函数。 UDF(user-defined function)作用于单个数据行,产生一个数据行作为输出。(数学函数,字符串函数) UDAF(用户定义聚集函数 User- Defined Aggregation Funcation):接收多个输入数据行,并产生一个输出数据行。(count,max) UDTF(表格生成函数 User-Defined Table Functions):接收一行输入,输出多行。(explode) (1)简单的DUF示例a.?导入hive需要的jar包,自定义一个java类继承UDF,重载 evaluate 方法; b.?打成 jar 包上传到服务器; c.?将 jar 包添加到 hive 的 classpath; d.?创建临时函数与开发好的 class 关联起来; e.?至此,便可以在 hql 在使用自定义的函数 (2)JSON数据解析UDF开发…… (3)Transform实现…… 四、特殊分隔符处理首先补充Hive读取数据的机制:
Hive 对文件中字段的分隔符默认情况下只支持单字节分隔符,如果数据文件中的分隔符是多 字符的,如下所示: 01||huangbo 02||xuzheng 03||wangbaoqiang 1、使用RegexSerDe正则表达式解析创建表:
导入数据并查询:
2、通过自定义的InputFormat处理特殊分隔符 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/23 17:15:30- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |