今天电脑奔溃后,使得原来一台虚拟机打不开,我删除后重新用集群中一台能用的虚拟机克隆后,链入原来的集群,发现可以使用
但后面发现,这样使得原来被克隆的虚拟机的DataNode不再出现在hadoop集群的资源中。
没找到后续方法,只能将集群中的data和logs文件删除,重新格式化,因为直接格式化会报错
注意:集群中的所有机器都需要删除这两个文件,具体文件位置为:
/opt/app/hadoop-3.1.3/data 和 /opt/app/hadoop-3.1.3/logs
然后重新格式化: hdfs namenode -format
之后重新启动集群发现可以使用
根据我同学说的,应该是克隆之后集群id会不一样,所有需要修改集群id(我没有使用该操作)
先查看能用的虚拟机的集群id: /opt/app/hadoop-3.1.3/data/dfs/data/current/BP-1215132245-192.168.1.129-1644146539810/current/VERSION 集群id在该文件内
然后修改不能用的虚拟机的集群id
我不清楚该做法是否有用,但我看着觉得没啥问题,如果不行的话勿喷,将先将原文件备份,不行的话改回去就行
|