SSRheart/HPC_wiki_docs

读取新硬盘时,提交任务看到的目录结构与在master下用shell看到的不一致

Closed this issue · 0 comments

表现

读取新硬盘上的模型时,出现FileNotFound错误;程序在新硬盘上新建的文件夹虽然创建成功,但却找不到。

原因

新硬盘只在master节点上被挂载到了/share/data目录,而在计算节点上仍只有原来挂载的master:/share/,因此计算节点的/share/data目录仍然指向原磁盘,最终导致提交任务时的读写空间与在master上看到的不一致。

暂时解决方案

在master节点,用bash shell,运行pdsh -w node[1-6] mount master:/share/data /share/data 手动挂载master的/share/data到计算节点1-6的/share/data目录,但这样重启HPC后配置将失效,因此最终解决方案还需要联系厂家确认硬盘自动挂载的配置。
可以通过df -h来确定挂载是否成功,如下则为正常状况:
image