Deep Learning Containers (DLC) のトレーニングジョブで、OSS、NAS、CPFS、MaxCompute などのストレージサービスを使用するように設定できます。これを行うには、ストレージをマウントするか、コードから直接アクセスします。これにより、トレーニングジョブでデータを読み書きできるようになります。このトピックでは、これらのストレージサービスの設定方法について説明します。
前提条件
PAI (DLC) を有効化し、ワークスペースを作成します。詳細については、「PAI を有効化し、デフォルトのワークスペースを作成する」をご参照ください。
(オプション) OSS ストレージを設定するには、次の操作を完了します。
OSS を有効化し、PAI に必要な権限を付与します。 詳細については、「OSS の有効化」および「PAI サービスアカウントへの権限付与」をご参照ください。
OSS バケットを作成します。詳細については、「コンソールでのクイックスタート」をご参照ください。
(オプション) NAS ストレージを使用するには、汎用 NAS ファイルシステムを作成します。詳細については、「ファイルシステムを作成する」をご参照ください。
(任意) MaxCompute ストレージを設定するには、MaxCompute を有効化し、MaxCompute プロジェクトを作成する必要があります。詳細については、「MaxCompute の有効化」および「MaxCompute プロジェクトの作成」をご参照ください。
OSS ストレージの使用
マウントによる設定
DLC トレーニングジョブを作成する際に、OSS ストレージをマウントできます。以下のマウントタイプがサポートされています。具体的な設定手順については、「トレーニングジョブの作成」をご参照ください。

マウントタイプ | 説明 |
[Mount dataset] | カスタムデータセットまたはパブリックデータセットをマウントします。
OSS タイプのデータセットを選択し、Mount Path を設定します。 DLC ジョブが実行されると、システムはこのパスを使用して OSS のデータにアクセスします。 |
[Mount storage] | OSS バケットパスをマウントし、[読み取り専用] スイッチを使用して読み書き権限を設定します。 |
DLC は、JindoFuse または ossfs を使用した OSS のマウントに対応しています。
マウントなしでの設定
DLC ジョブは、OSS PyTorch コネクターまたは OSS SDK を使用して、OSS への読み書きを実行できます。トレーニングジョブを作成する際に、関連するコードファイルを設定できます。コード例については、「AI/ML 向け OSS コネクター」または「OSS SDK」をご参照ください。

NAS/CPFS ストレージの使用
Deep Learning Containers (DLC) ジョブの作成時に、NAS/CPFS タイプのカスタムデータセットをバインドするか、ストレージをマウントすることで、NAS/CPFS ストレージを使用できます。設定の詳細については、「NAS/CPFS の使用」をご参照ください。

マウントタイプ | 説明 |
[Mount dataset] | カスタムデータセットをマウントします。[読み取り専用] スイッチを使用して読み書き権限を設定できます。 |
[Mount storage] | NAS/CPFS ファイルシステムをマウントし、[読み取り専用] スイッチを使用して読み書き権限を設定します。 また、[詳細設定] で nconnect パラメーターを設定して、NAS のアクセススループットを向上させることもできます。この Linux NFS クライアントのマウントオプションは、クライアントとサーバーの間に複数の TCP 接続を作成することで、パフォーマンスを向上させます。詳細については、「Linux OS での NAS アクセスパフォーマンスの低下を解決するにはどうすればよいですか?」をご参照ください。以下にパラメーターの例を示します。 |
MaxCompute ストレージの使用
MaxCompute ストレージを使用するには、マウントするのではなく、コードから直接アクセスします。トレーニングジョブを作成する際に、関連するコードファイルを設定できます。コード例については、「MaxCompute の使用」をご参照ください。

よくある質問
Q: paiio の読み取り時に 'Killed' メッセージが表示される
A: この問題はメモリ不足が原因で発生します。paiio にはリソース制限がないため、MaxCompute からデータを読み取ると、メモリを大量に消費する可能性があります。オペレーティングシステムやその他のコンポーネントもメモリを消費します。