IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> HBase与Hive的关系 -> 正文阅读

[大数据]HBase与Hive的关系

目录

什么是HBase?

什么是Hive?

异同之处

Hive-On-HBase

配置文件的修改

Hive中创建一个外部表关联HBase中的表


什么是HBase?

1.首先它是一个非关系型数据库,不对数据进行计算、加工,仅限于查询与存储,该数据库里面存储的是结构化与非结构化数据,因此不适合对其进行关联查询,像SQL语言那种JOIN操作是无法实现的。

2.基于hadoop架构,将数据存储至HDFS的DataNode中,提供高容错的支持,HBase中的RegionServer对其以region的格式进行管理,里面存储数据的模式是K-V键值对形式

3.需要zookeeper的支持以及提供master的高可用、RegionServer的监控、元数据的入口以及集群配置的维护等工作,客户端在HBase中进行读写需要访问zookeeper获取元数据表所在的RegionServer。

4.在面对大量数据的情况下,通过划分了region以及设置了合理的rowkey,能够提供高效的数据访问以及查询速度。

什么是Hive?

1.hive只是一个数据库管理工具,本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,提供了一个类SQL的查询语言,程序员上手简单。

2.和HBase一样,同样基于hadoop架构,将数据文件存储至DN上,编写的HQL语言最终通过hive的解析器、优化器、编译器、执行器转换为MapReduce运行。

3.由于是通过MR进行查询,一个简单的查询结果可能通过几个MR完成,因此延时较高。


异同之处

在大致了解了Hive与HBase后,我们可以不难看出,这两者没有什么必然联系,就像是大象与鲸鱼般的关系,任意一处都是不同点。

但是有一些相同点可以总结得出:

1.都基于hadoop架构,都在HDFS上进行数据存储。

2.都能够对数据进行增、删、改、查操作。

Hive-On-HBase

配置文件的修改

在hive-site.xml中添加zookeeper的参数属性:

    <property>
        <name>hive.zookeeper.quorum</name>
        <value>long1,long2,long3</value>
    </property>
#填主机名
    <property>
        <name>hive.zookeeper.client.port</name>
        <value>2181</value>
    </property>

Hive中创建一个外部表关联HBase中的表

首先在hive中创建外部表

CREATE EXTERNAL TABLE relevance_hbase_student(
id int,
name string,
age int)
STORED BY 
'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = 
":key,info:name,info:age") 
TBLPROPERTIES ("hbase.table.name" = "hbase_student_table");

这样就能使用hive函数进行分析了

select * from relevance_hbase_student;

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-10 13:29:13  更:2021-08-10 13:30:13 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年5日历 -2024/5/17 17:18:04-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码