すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:分散トレーニング (DLC) での OSS のマウント

最終更新日:Mar 01, 2026

Deep Learning Containers (DLC) トレーニングジョブを送信する際、コード構成またはマウントを使用して Object Storage Service (OSS)、NAS、CPFS、または MaxCompute ストレージを構成できます。これにより、トレーニング中に選択したストレージサービスから直接データを読み書きできます。このトピックでは、DLC トレーニングジョブ用に OSS、MaxCompute、NAS、または CPFS ストレージを構成する方法について説明します。

前提条件

OSS ストレージの使用

マウントによる OSS ストレージの構成

分散トレーニング (DLC) ジョブを作成する際、OSS ストレージをマウントできます。次のマウントタイプがサポートされています。構成の詳細については、「トレーニングジョブの作成」をご参照ください。

image

マウントタイプ

説明

Mount dataset

データセット (カスタムまたはパブリック) を使用してマウントします。次の点にご注意ください:

  • パブリックデータセットは読み取り専用マウントモードのみをサポートします。

  • カスタムデータセット (Object Storage Service (OSS)) の場合、[読み取り専用] トグルを使用して読み取りおよび書き込み権限を設定します。

タイプ OSS のデータセットを選択し、「Mount Path」を設定します。DLC ジョブが実行されると、システムがこのパスで OSS データにアクセスします。

Mount storage

OSS バケットパスをマウントし、[読み取り専用] トグルを使用して読み取りおよび書き込み権限を設定します。

DLC は JindoFuse または ossfs を使用して OSS をマウントします:

  • JindoFuse がデフォルトで使用されます。ただし、Data Lake Compute (DLC) のデフォルト構成には機能上の制限があり、すべてのシナリオに適しているとは限りません (詳細については、「JindoFuse」をご参照ください)。特定のシナリオに合わせて パラメーターを調整できます。詳細については、「JindoFuse」をご参照ください。

  • ossfs:OSS バケットパスをマウントする際、[詳細設定]{"mountType":"ossfs"} を設定して ossfs を使用します。

マウントなしでの OSS ストレージの構成

DLC ジョブは、OSS PyTorch コネクタまたは OSS SDK を使用して OSS からのデータの読み取りと書き込みをサポートします。トレーニングジョブを作成する際、コード構成を使用して必要なコードファイルを含めることができます。コード例については、「AI/ML 向け OSS コネクタ」または「OSS SDK」をご参照ください。

image

NAS/CPFS ストレージの使用

分散トレーニング (DLC) ジョブを作成する際、NAS/CPFS タイプのカスタムデータセットをアタッチするか、ストレージマウントを使用することで、NAS/CPFS ストレージを利用できます。構成の詳細については、「NAS/CPFS の使用」をご参照ください。

image

マウントタイプ

説明

Mount dataset

カスタムデータセットを使用してマウントします。[読み取り専用] トグルを使用して読み取りおよび書き込み権限を設定します。

Mount storage

NAS/CPFS ファイルシステムをマウントし、[読み取り専用] トグルを使用して読み取りおよび書き込み権限を設定します。

また、[詳細設定] で nconnect パラメーターを設定することで、DLC コンテナーが NAS にアクセスする際のスループットパフォーマンスを向上させることもできます。nconnect は、クライアントとサーバー間により多くの TCP 接続を確立することでスループットを向上させる NFS クライアントの Linux マウントオプションです。詳細については、「Linux での NAS パフォーマンスが低い問題を解決するにはどうすればよいですか?」をご参照ください。パラメーター例:

// <example value> を特定の正の整数に置き換えます。
{"nconnect":"<example value>"}

MaxCompute ストレージの使用

MaxCompute ストレージはマウントせずに構成できます。トレーニングジョブを作成する際、コード構成を使用して必要なコードファイルを含めます。コード例については、「MaxCompute の使用」をご参照ください。

image

よくある質問

Q:テーブル読み取り時に paiio がエラーなしでログに "killed" と表示されるのはなぜですか?

システムリソースが不足している場合、制限のない paiio が MaxCompute データをメモリに読み込む際にメモリ肥大化を引き起こします。オペレーティングシステムや他のシステムコンポーネントもメモリを消費するため、リソース不足の一因となります。