管理节点更换磁盘导致JournalNode同步问题

    科技2024-04-11  101

    现象

    集群配置了NameNode HA,突然发生一台NameNode节点所在的数据盘如/data1磁盘故障需要更换磁盘,原来的磁盘下面的目录将都不可用。 /data1目录下面的主要目录为dfs目录, 更换磁盘并启动hadoop相关服务后,我们发现dfs目录自动创建dfs/dn、dfs/jn及dfs/nn都已经创建,但HDFS仍然不正常,具体为更换磁盘节点的NameNode服务及JournalNode服务异常,如下图所示

    解决方案

    出现此问题,是因为更换了磁盘后dfs/jn目录下没有VERSION文件用来恢复,查看dfs/jn/目录下确实为空。解决方法是重新创建对应目录结构,并拷贝其他JouralNode上的VERSION文件,之后重启JournalNode服务,会自动进行目录的初始化并自动同步日志。

    cd /data1/dfs/jn mkdir -p nameservice1/current scp 10.19.41.60:/data1/dfs/jn/nameservice1/current/VERSION :/data1/dfs/jn/nameservice1/current/ chown -R hdfs.hdfs /data1/dfs/jn
    Processed: 0.017, SQL: 9