安装依赖包

DLRM模型训练前需要安装数据预处理、模型训练、推理时依赖的第三方库h5py、TensorFlow 2.13.0和tqdm等。

  1. 进入conda base环境。

    1
    conda activate
    

  2. 创建conda虚拟环境。

    1
    conda create -n  dlrm  python=3.9
    

    若回显信息如图所示,则表示成功创建conda虚拟环境。

    • -n:用于指定新创建环境的名称。
    • python=3.9:用于指定Python的版本。

  3. 切换至新创建的conda虚拟环境dlrm

    1
    conda activate dlrm
    

  4. 验证新虚拟环境Python版本。

    1
    python -V 
    

    如回显Python 3.9.19,则正确安装Python。

  5. 安装第三方库h5py。

    1
    conda install h5py=3.11.0
    

    回显信息显示如图所示,则证明安装成功。

  6. 安装TensorFlow 2.13.0和tqdm。

    1
    pip install tensorflow==2.13.0 tqdm==4.66.2
    

    回显信息显示如图所示,则证明安装成功。