| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> Hive数据定义及表的创建 -> 正文阅读 |
|
[大数据]Hive数据定义及表的创建 |
(一)Hive数据定义Hive中数据库的概念本质上仅仅是表的一个目录或者命名空间。这样做可以避免表命名冲突。如果用户没有显示指定数据库,那么会使用默认的数据库“default” 1.查看Hive中所包含的所有数据库
2.切换到xx数据库
3.创建数据库
4.查看数据库信息
5.删除数据库
默认情况下,Hive不允许删除一个里面有表存在的数据库,如果像删除数据库,那么先将数据库中的表全部删除,要么可以使用cascade关键字,使用该关键字后,hive会将自己数据库下的表全部删除。restrict 关键字就是默认情况,即如果有表存在则不允许删除数据库。 6.查看数据库的存储位置
7.在指定位置创建数据库
(二)Hive中表的创建Hive中表分为内部表(MANAGED_TABLE)和外部表(EXTERNAL_TABLE) 1.内部表? ? ? ? (1)内部表在drop时,会删除HDFS上的数据 ? ? ? ? (2)内部表通常作为Hive的中间表、结果表,一般不需要从外部(如:本地文件、HDFS)加载数据 2.外部表? ? ? ? (1)外部表在drop时,不会删除HDFS上的数据 ? ? ? ? (2)外部表通常作为源数据表,需要定期将外部数据映射到表中 创建外部表:
查询表的信息:
查询表的详细信息:
创建表时的参数和关键字含义:
3.复制表-使用like关键字对于管理表,还可以对一张存在的表进行表结构复制,但是不会复制数据: 【例】复制person3为person4
4.分区表Hive中数据分区可分为: (1)单值分区 ? ? ? ? 《1》静态分区:导入数据时需要手动指定分区 ? ? ? ? 《2》动态分区:导入数据时,由系统动态判断目标分区 (2)范围分区 ? ? ? ? 单值分区每个分区对应分区键的一个取值,而每个范围分区则对应分区键的一个区间,只要落在指定区间内的记录都被存储在对应分区下。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/24 0:47:28- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |