IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 五 Hive-数据的导入和导出 -> 正文阅读

[大数据]五 Hive-数据的导入和导出

五, Hive-数据的导入和导出

5.1 数据导入

法1, 向表中装载数据(load)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oP6YViMW-1627981666146)(2021-08-03-14-33-12.png)]

[案例实操]

  1. 创建表
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-W8nNN6Hh-1627981666150)(2021-08-03-14-44-50.png)]
  2. 加载本地文件到此表中
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XHj93LrH-1627981666151)(2021-08-03-14-48-41.png)]
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-X280mdEU-1627981666155)(2021-08-03-14-49-10.png)]
  3. 加载HDFS文件到此表中不进行覆盖
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9bEVEknn-1627981666156)(2021-08-03-14-54-09.png)]
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-voKAdli7-1627981666157)(2021-08-03-14-55-59.png)]

执行load之后, HDFS的inpat路径中就不再含有这个数据文件, 因为这个文件被移动到hdfs中存储hive数据的目录中(在hdfs中默认路径为 /user/hive/warehouse/表名)去了.

  1. 加载HDFS文件到此表中进行覆盖
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Y0zMQblu-1627981666158)(2021-08-03-15-13-03.png)]
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YLatfdne-1627981666159)(2021-08-03-15-12-57.png)]

法2, 通过查询语句向表中插入数据(insert)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7Ef7M75G-1627981666160)(2021-08-03-15-14-08.png)]

法3, 通过查询表来新建表(As select 语句)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vXfXlX7K-1627981666161)(2021-08-03-15-58-05.png)]

法3, 创建表时通过 Location指定加载数据路径(通常这个表是外部表)

  1. 准备文件
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rFg47p3D-1627981666162)(2021-08-03-15-50-26.png)]
  2. 通过 Location指定加载数据路径
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qNkFAclG-1627981666163)(2021-08-03-15-50-09.png)]

法4, 从HDFS文件中Import(导入)数据到指定 Hive表中

前置条件: 先Export 导出

5.2 数据导出

法1, Insert 导出

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vLogLXVM-1627981666164)(2021-08-03-16-15-53.png)]

法2, Hadoop命令导出到本地(hdfs 的下载)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tTYBsvrB-1627981666165)(2021-08-03-16-25-17.png)]

法3, Hive shell命令 导出

注意: 图中小错误, 一个>是覆盖. 两个>>是追加
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XXslrv5O-1627981666292)(2021-08-03-16-24-56.png)]

法4, Export 导出到HDFS上

  1. export table xx to ‘path’

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BTIBtN58-1627981666166)(2021-08-03-16-35-28.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-80w6mp97-1627981666167)(2021-08-03-16-35-12.png)]

  1. import table xx from ‘path’

千万要注意. import到的表要求: 要么不存在, 要么不包含数据(空表)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4bUNRYOl-1627981666168)(2021-08-03-16-45-40.png)]

  • 新表
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-c0G3peBQ-1627981666169)(2021-08-03-16-46-11.png)]
  • 已存在的空表
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aMxt5fTM-1627981666170)(2021-08-03-16-49-39.png)]

法5, Sqoop导出(以后学)

法6, 清除表中数据(Truncate)

Truncate只能清除管理表对应HDFS上的数据(内部表还在),无法清除外部表(会报错).
, 清除表中数据(Truncate)

Truncate只能清除管理表对应HDFS上的数据(内部表还在),无法清除外部表(会报错).
drop命令只能删除表, 无法删除HDFS上的数据.

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-04 11:16:50  更:2021-08-04 11:18:55 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/17 19:24:21-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码