2021SC@SDUSC
目录
一、Hbase概述
二、配置准备
三、Hbase下载与配置
四、任务划分
一、Hbase概述
HBase是Hadoop的生态系统,是建立在Hadoop文件系统(HDFS)之上的分布式、面向列的数据库,通过利用Hadoop的文件系统提供容错能力。如果你需要进行实时读写或者随机访问大规模的数据集的时候,请考虑使用HBase。
HBase作为Google Bigtable的开源实现,Google Bigtable利用GFS作为其文件存储系统类似,则HBase利用Hadoop HDFS作为其文件存储系统;Google通过运行MapReduce来处理Bigtable中的海量数据,同样,HBase利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用Chubby作为协同服务,HBase利用Zookeeper作为对应。
二、配置准备
Hbase要求JDK
相关教程:ubuntu16.04搭建jdk1.8运行环境_朝花夕拾-CSDN博客_jdk ubuntu
三、Hbase下载与配置
官网地址:Apache HBase – Apache HBase? Home
选择一个版本进行下载,解压下载的文件,然后进入到那个要解压的目录。
$ tar xfz hbase-0.95-SNAPSHOT.tar.gz
$ cd hbase-0.95-SNAPSHOT
编辑conf/hbase-site.xml,这是HBase的主要配置文件。此时,您只需要在HBase和ZooKeeper写入数据的本地文件系统上指定目录即可。默认情况下,在/tmp下创建一个新目录。许多服务器被配置为在重启时删除/tmp的内容,所以你应该在其他地方存储数据。以下配置将把HBase的数据存储在hbase目录下的testuser 用户主目录中。将<property> 标签粘贴到标签下<configuration> ,在新的HBase安装中应该是空的。
独立HBase的hbase-site.xml:
<configuration>
<property>
<name>hbase.rootdir</name>
<value>file:///home/testuser/hbase</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/home/testuser/zookeeper</value>
</property>
</configuration>
打开HBase主文件夹,然后运行HBase启动脚本,如下所示:
$cd /usr/local/HBase/bin
$./start-hbase.sh
如果一切顺利,当运行HBase启动脚本,它会提示一条消息:HBase已经启动
starting master, logging to /usr/local/HBase/bin/../logs/hbase-tpmaster-localhost.localdomain.out
四、任务划分
我负责的是Hbase读写过程的源码分析,后续可能会根据进度动态调整。
如有错误还请指出,感谢
|