数据存储特点
数据读写一定依赖于元数据信息 , 元数据信息丢失,数据无法找到
[root@linux03 subdir0]# pwd
/opt/hdpdata/data/current/BP-1889122556-192.168.133.33-
1638070839467/current/finalized/subdir0/subdir0
[root@linux03 subdir0]#
-
在HDFS上存储的数据 , 实时不高 ,读取效率低 -
HDFS上数据 , 管理是以文件块为单位, 所以不能直接随机的更新数据 -
适合一次存储, 多次读取分析的非实时性需求 -
HDFS不适合存储大量的小文件 , 每个小文件都会记录元数据 , 增加NN的压力 -
HDFS也不是可以无限扩容(内存有限)
NN和DN通信
? ? ??
?
<property>
<name>dfs.namenode.heartbeat.recheck-interval</name>
<value>300000</value>
<description>
This time decides the interval to check for expired datanodes.
With this value and dfs.heartbeat.interval, the interval of
deciding the datanode is stale or not is also calculated.
The unit of this configuration is millisecond.
</description>
</property>
<property>
<name>dfs.heartbeat.interval</name>
<value>3</value>
<description>Determines datanode heartbeat interval in seconds.</description>
</property>
|