Deep Learning Instanceを使用するには、まずインスタンスを作成する必要があります。
Deep Learning Instance作成ボタンをクリックするとMachine Learning > Deep Learning Instance > インスタンス作成に移動します。
Deep Learning Instanceでは次のバージョンのソフトウェアが提供されます。
Version | Deep Learning Framework | NVIDIA CUDA | NVIDIA cuDNN | OS |
---|---|---|---|---|
v5.0.0 | TensorFlow 2.16 | 12.3 | 8.9 | Ubuntu 22.04 |
PyTorch 2.4 | 12.4 | 9.1 | Ubuntu 22.04 | |
v4.0.1 | TensorFlow 2.16 | 12.3 | 8.9 | Ubuntu 22.04 |
PyTorch 2.2 | 12.1 | 8.9 | Ubuntu 22.04 | |
v3.1.1 | TensorFlow 2.12.1 | 11.8 | 8.6 | Ubuntu 22.04 |
PyTorch 2.0.1 | 11.8 | 8.7 | Ubuntu 22.04 |
このソフトウェアにはNVIDIA Corporationで
提供したソースコードが含まれています。 License
Deep Learning InstanceはMiniforgeをPythonパッケージマネージャーとして使用し、conda forgeをパッケージリポジトリとして利用しています。 AnacondaやMinicondaをPythonパッケージマネージャとして使用してAnacondaのリポジトリを利用したい場合は、Anacondaのライセンスポリシーを確認してから使用してください。
設定を完了した後にインスタンスを作成します。インスタンス作成の詳細についてはInstance概要を参照してください。
condaコマンドを使用してMinicondaにインストールされた開発環境を確認します。
$ conda info --envs
# conda environments:
#
/opt/intel/oneapi/intelpython/latest
/opt/intel/oneapi/intelpython/latest/envs/2021.4.0
base * /root/miniconda3
pt_py38 /root/miniconda3/envs/pt_py38
tf2_py38 /root/miniconda3/envs/tf2_py38
[参考]
詳細な使用方法についてはMiniconda文書を参考してください。
まずTensorFlow環境を有効にします。
(base) root@b64e6a035884:~# conda activate tf2_py38
(tf2_py38) root@b64e6a035884:~#
次のようにTensorFlowトレーニングをテストします。
$ cd ~/
$ git clone https://github.com/tensorflow/models.git
$ cd models
$ git checkout tags/v2.4.0
$ git status
HEAD detached at v2.4.0
nothing to commit, working tree clean
$ mkdir $HOME/models/model
$ mkdir $HOME/models/dataset
$ vim train.sh
#!/bin/bash
export PYTHONPATH=$HOME/models
export NCCL_DEBUG=INFO
MODEL_DIR=$HOME/models/model
DATA_DIR=$HOME/models/dataset
# 1つ以上のGPUを使用する時に設定
NUM_GPUS=1 # 例) NUM_GPUS=2
python $HOME/models/official/vision/image_classification/mnist_main.py \
--model_dir=$MODEL_DIR \
--data_dir=$DATA_DIR \
--train_epochs=2 \
--distribution_strategy=mirrored \ # 1つ以上のGPUを使用する時に設定
--num_gpus=$NUM_GPUS \ # 1つ以上のGPUを使用する時に設定
--download
$ chmod +x train.sh
$ ./train.sh
[参考]
詳細な使用方法についてはTensorFlowチュートリアルを参照してください。
まずPyTorch環境を有効にします。
(tf2_py38) root@b64e6a035884:~# conda deactivate
(base) root@b64e6a035884:~# conda activate pt_py38
(pt_py38) root@b64e6a035884:~#
次のようにPyTorchトレーニングをテストします。
$ cd ~/
$ git clone https://github.com/pytorch/examples.git
$ cd examples/mnist
$ python main.py --epochs 1
[参考]
詳細な使用方法についてはPyTorchチュートリアルを参照してください。