Object Storage Service (OSS) Connector for AI/ML は、OSS から大規模なトレーニングデータを効率的に読み取れるようにし、PyTorch のモデルトレーニングを大幅に高速化し、AI/ML タスクのパフォーマンスと効率を最適化します。
メリット
|
項目 |
OSS Connector for AI/ML を使用しない場合 |
OSS Connector for AI/ML を使用する場合 |
|
パフォーマンス |
パフォーマンスを手動で最適化する必要があり、非効率的な場合があります。 |
OSS Connector for AI/ML は、OSS データのダウンロードとチェックポイントストレージのパフォーマンスを自動的に最適化します。 |
|
データローディング方法 |
事前にデータをダウンロードする必要があり、コストと管理ワークロードが増加します。 |
OSS Connector for AI/ML はストリームロードをサポートし、コストと管理の複雑さを軽減します。 |
|
データアクセス |
アダプターを使用してデータを読み書きする必要があり、アクセスの複雑さが増します。 |
OSS Connector for AI/ML は OSS のデータを直接読み書きし、アクセスを簡素化します。 |
|
設定の難易度 |
コードをコンパイルする必要があり、設定が困難です。 |
OSS Connector for AI/ML は、シンプルな設定オプションを提供し、開発効率を向上させます。 |
仕組み
次の図は、OSS Connector for AI/ML が PyTorch トレーニングジョブや OSS データと連携する仕組みを示しています。
機能の説明
次の表に、OSS Connector for AI/ML の機能を示します。
|
項目 |
機能 |
クラス |
メソッド |
|
マップスタイルデータセット |
トレーニング中に特定のデータを迅速に取得するためのランダムアクセスをサポートします。 |
OssMapDataset クラスと OssIterableDataset クラスは、データセットを構築するために同じメソッドを提供します。
|
|
|
反復可能スタイルデータセット |
大量の連続データを効率的に処理するための順次ストリーミング読み取りをサポートします。 |
||
|
チェックポイント API 操作 |
モデルトレーニング中に OSS からチェックポイントをロードし、定期的に OSS にチェックポイントを保存することで、トレーニングワークフローを簡素化します。 |
|
手順
-
PyTorch トレーニングジョブで OSS のデータにアクセスして保存する前に、OSS Connector for AI/ML をインストールして設定する必要があります。詳細については、「OSS Connector for AI/ML のインストール」および「OSS Connector for AI/ML の設定」をご参照ください。
-
OSS Connector for AI/ML をインストールして設定した後、PyTorch トレーニングジョブで次の操作を実行できます:
-
OssMapDataset を使用して、ランダム読み取りに適したマップスタイルデータセットを構築します。詳細については、「OSS のデータを使用してランダム読み取りに適したマップデータセットを構築する」をご参照ください。
-
OssIterableDataset を使用して、順次ストリーミング読み取りに適した反復可能スタイルデータセットを構築します。詳細については、「OSS データから順次ストリーミング読み取り用の反復可能データセットを構築する」をご参照ください。
-
OssCheckpoint を使用して、チェックポイントを保存し、アクセスします。詳細については、「OSS でのチェックポイントの保存とアクセス」をご参照ください。
-
説明
マップスタイルデータセットと反復可能スタイルデータセットのデータと、チェックポイントは同じタイプです。データタイプでサポートされているメソッドの詳細については、「OSS Connector for AI/ML のデータタイプ」をご参照ください。
-
ユースケース
-
クイックスタートとして、OSS Connector for AI/ML は、OSS データを使用して手書き数字認識モデルをトレーニングし、トレーニング結果を OSS に保存するデモを提供します。詳細については、「OSS Connector for AI/ML クイックスタート」をご参照ください。
-
パフォーマンスをさらに向上させるには、OSS の内部エンドポイントの代わりに OSS アクセラレータの高速化エンドポイントを使用します。パフォーマンスの比較については、「パフォーマンス テスト」をご参照ください。
-
コンテナ環境で OSS Connector for AI/ML を使用するには、OSS Connector for AI/ML 環境を含む Docker イメージを使用できます。Docker イメージのビルド方法の詳細については、「OSS Connector for AI/ML 環境を含む Docker イメージのビルド」をご参照ください。