凌雲向けクラウド並列ファイルストレージ (CPFS) は、バッチおよびストリーミングデータフロータスクをサポートしています。ビジネス要件に基づいてタスクの種類を選択できます。
バッチタスク
バッチタスクを使用すると、1 つのディレクトリのすべてのファイルを一度に別のディレクトリにインポートできます。このタスクの種類は、トレーニングタスクが開始される前にデータセットをプリロードするのに適しています。
ストリーミングタスク
ストリーミングタスクを使用すると、1 つのディレクトリから別のディレクトリにファイルを 1 つずつインポートできます。このタスクの種類は、モデルトレーニングの計算タスク中に複数のチェックポイントファイルを継続的に読み書きするのに適しています。
凌雲向け CPFS V2.6.0 以降のみがストリーミングタスクをサポートしています。
ストリーミングタスクは、API オペレーションを呼び出すことによってのみ使用できます。詳細については、ストリーミングデータフロータスクのベストプラクティスを参照してください。
タスクの説明
データフロータスクは、データ操作に基づいて、インポート、エクスポート、StreamImport、StreamExport の種類に分類されます。
種類 | 説明 |
インポート | ソースオブジェクトストレージサービス (OSS) バケットから凌雲向け CPFS ファイルシステムに一度にデータをインポートします。
|
エクスポート | 凌雲向け CPFS ファイルシステムから OSS バケットに指定されたデータを一度にエクスポートします。 エクスポートパスは、凌雲向け CPFS ファイルシステム内のファイルまたはディレクトリのパスです。データフロータスクは、凌雲向け CPFS ファイルシステム内のファイルまたはディレクトリのパスから OSS バケットにデータをエクスポートします。 警告
|
StreamImport | ソース OSS バケットから凌雲向け CPFS ファイルシステムに指定されたオブジェクトを 1 つずつインポートします。StreamImport タスクは、API オペレーションを呼び出すことによってのみ使用できます。
|
StreamExport | 凌雲向け CPFS ファイルシステムから OSS バケットに指定されたファイルを 1 つずつエクスポートします。StreamExport タスクは、API オペレーションを呼び出すことによってのみ使用できます。 エクスポートパスは、凌雲向け CPFS ファイルシステム内のファイルまたはディレクトリのパスです。データフロータスクは、凌雲向け CPFS ファイルシステム内のファイルまたはディレクトリのパスから OSS バケットにデータをエクスポートします。 |