IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Hive的数据导入、导出 -> 正文阅读

[大数据]Hive的数据导入、导出

1.数据的导入

1.1装载数据

向表中装载数据

load data [local] inpath '/opt/module/datas/test.txt' [overwrite] | into table 具体表 [partition (partcol1=val1,)];

local:表示从本地加载数据到hive表;否则从HDFS加载数据到hive表

overwrite:表示覆盖表中已有数据,否则表示追加

into table:表示加载到哪张表

加载HDFS文件到hive中,需要先将文件上传到HDFS中,然后加载HDFS数据

dfs -put /opt/module/datas/test.txt /user/hadoop102/hive;

load data inpath '/user/hadoop102/hive/test.txt' into table default.test;

1.2通过查询语句向表插入数据(表数据导入表)

基本插入数据

insert into table  具体表 values(添加值);

基本模式插入:

insert overwrite table 具体表1
select 字段名1 from 具体表2;

将具体表2的字段名1的值覆盖到具体表1

多插入模式(根据多张表查询结果)

from test
insert overwrite table test partition(month='202201')
select id, name where month='202203'
insert overwrite table test partition(month='202202')
select id, name where month='202203';

多插入模式的几点注意,此处引用
1、要将所要执行查询的表语句“from表名”,放在最开头的位置。
2、不能向相同分区插入数据,否则报错
3、如果是非分区表,不能插入相同的表
4、多插入模式是一个优化方式,减少了JOB中的MR的STAGE数量,达到优化目的。

2.数据的导出

2.1Insert导出

格式化导出到本地

insert overwrite local directory '/opt/module/datas/export/test'
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'(与创建表时的格式化方法一致) 
select * from test;

格式化导出到HDFS

insert overwrite directory '/user/hadoop102/test1'
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' 
select * from test;

2.2用hadoop的-get命令导出

dfs -get /user/hive/warehouse/test/month=202203/000000_0
/opt/module/datas/export/test1.txt;

2.3Hive Shell 命令导出

hive -f/-e ‘执行语句或者脚本’ > file

bin/hive -e 'select * from default.test;' >
 /opt/module/datas/export/test2.txt;

3.清除表数据

与mysql一致,都是清除数据,保留表结构

truncate table student;
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-04-07 22:46:53  更:2022-04-07 22:47:01 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 5:20:37-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码