| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> HBase与Hive的关系 -> 正文阅读 |
|
[大数据]HBase与Hive的关系 |
目录 什么是HBase?1.首先它是一个非关系型数据库,不对数据进行计算、加工,仅限于查询与存储,该数据库里面存储的是结构化与非结构化数据,因此不适合对其进行关联查询,像SQL语言那种JOIN操作是无法实现的。 2.基于hadoop架构,将数据存储至HDFS的DataNode中,提供高容错的支持,HBase中的RegionServer对其以region的格式进行管理,里面存储数据的模式是K-V键值对形式 3.需要zookeeper的支持以及提供master的高可用、RegionServer的监控、元数据的入口以及集群配置的维护等工作,客户端在HBase中进行读写需要访问zookeeper获取元数据表所在的RegionServer。 4.在面对大量数据的情况下,通过划分了region以及设置了合理的rowkey,能够提供高效的数据访问以及查询速度。 什么是Hive?1.hive只是一个数据库管理工具,本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,提供了一个类SQL的查询语言,程序员上手简单。 2.和HBase一样,同样基于hadoop架构,将数据文件存储至DN上,编写的HQL语言最终通过hive的解析器、优化器、编译器、执行器转换为MapReduce运行。 3.由于是通过MR进行查询,一个简单的查询结果可能通过几个MR完成,因此延时较高。 异同之处在大致了解了Hive与HBase后,我们可以不难看出,这两者没有什么必然联系,就像是大象与鲸鱼般的关系,任意一处都是不同点。 但是有一些相同点可以总结得出: 1.都基于hadoop架构,都在HDFS上进行数据存储。 2.都能够对数据进行增、删、改、查操作。 Hive-On-HBase配置文件的修改在hive-site.xml中添加zookeeper的参数属性:
Hive中创建一个外部表关联HBase中的表首先在hive中创建外部表
这样就能使用hive函数进行分析了 select * from relevance_hbase_student; |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/18 21:05:29- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |