多节点运行和验证

  1. 使用PuTTY工具,以root用户登录服务器。
  2. 执行以下命令解压TEST41算例包。

    tar zxf TEST41.tar.gz

  3. 执行以下命令进入TEST41算例目录。

    cd TEST41/NHC

  4. 执行以下命令创建“hostfile”文件并添加节点信息。

    echo -e 'node1\nnode2\n…\nnodex' > /path/to/HOSTFILE

    “node1、node2、…、nodex”分别为各节点的主机名,可通过命令hostname查询各主机名,“\n”为换行符。

  5. 在node2服务器节点窗口,执行以下命令配置环境变量。

    vi /root/.bashrc

  6. 按“i”进入编辑模式,在“.bashrc”文件末尾新增如下内容

    export PATH=/path/to/GNU/bin:/path/to/OPENMPI/bin:$PATH
    export  LD_LIBRARY_PATH=/path/to/GNU/lib64:/path/to/OPENMPI/lib:$LD_LIBRARY_PATH
    export PATH=/path/to/DL_POLY/dl_poly-RELEASE-1-10/execute:$PATH

  7. 按“Esc”键,输入:wq!,按“Enter”保存并退出编辑。
  8. 执行以下命令进行算例的多节点运行。

    mpirun --allow-run-as-root -np 256 -N 128 -x OMP_NUM_THREADS=1 --hostfile /path/to/HOSTFILE -mca btl ^openib DLPOLY.X

    查看“OUTPUT”日志的指标“time elapsed since job start = XX seconds”,时间单位是“s”,数值越少性能越优。

    输出的结果样例如图1所示。

    图1 结果样例