データ転送サービスは、MaxCompute の最も重要なデータトンネルです。データ転送サービスは、バッチ操作に適した標準トンネルと、ストリーミングモードでのデータ書き込みに適したストリームトンネルをサポートしています。 このサービスでは、共有リソースグループも提供されます。 指定されたクォータが使い果たされていない場合は、共有リソースグループを無料で使用できます。
操作タイプ
コマンドを実行してデータを転送する
現在、MaxCompute クライアントでのみデータ転送のためのコマンドを実行できます。
データのバッチ操作
標準トンネルを使用して、オフラインデータのバッチ操作(テーブルへのデータのアップロード、テーブルからのデータのダウンロード、インスタンスデータのクエリ結果のダウンロードなど)を実行できます。
ストリーミングモードでのデータ書き込み
ストリームトンネルを使用して、ストリーミングモードでデータをマイクロバッチでテーブルに書き込むことができます。

データ転送サービスの制限
標準トンネルの制限
データのアップロード
項目
制限
UploadSession のライフサイクル
24 時間
UploadSession によって書き込まれるブロック数
20,000
ブロックの書き込み速度
10 MB/s
ブロック内のデータ量
100 GB
テーブルに対して作成された UploadSession の数
5 分あたり 500 UploadSessions
テーブルに書き込まれるブロック数
5 分あたり 500 ブロック
テーブルに対して送信される同時実行 UploadSession の数
32
単一テーブル書き込みコミットの数
15 秒ごとに 75 回。
同時に書き込まれるブロック数
同時スロット数によって異なります。ブロックが書き込まれると、スロットが占有されます。
同時書き込み
MaxCompute は、原子性、一貫性、分離性、耐久性(ACID)の原則に基づいて同時書き込みが実行されることを保証します。ACID セマンティクスの詳細については、「ACID セマンティクス」をご参照ください。
データのダウンロード
項目
制限
DownloadSession のライフサイクル
24 時間
InstanceDownloadSession のライフサイクル
24 時間、インスタンスのライフサイクルによって異なります。
プロジェクトに対して作成された InstanceDownloadSession の数
5 分あたり 200 InstanceDownloadSessions
テーブルに対して作成された DownloadSession の数
5 分あたり 200 DownloadSessions
単一のダウンロードリクエストの速度
10 MB/s
同時に作成できる DownloadSession の数
同時スロット数によって異なります。DownloadSession が作成されると、スロットが占有されます。
同時に作成できる InstanceDownloadSession の数
同時スロット数によって異なります。InstanceDownloadSession が作成されると、スロットが占有されます。
同時ダウンロードリクエストの数
同時スロット数によって異なります。データダウンロードリクエストによってスロットが占有されます。
説明Delta Table Upsert 機能は、バッチデータのアップロードとダウンロードでサポートされています。この機能には次の制限があります。
UpsertSession のライフサイクル: 24 時間
UpsertSession の最大データ書き込み速度: テーブル数またはパーティションのバケット数 × 10 MB/s
占有できる最大スロット数: テーブル数またはパーティションのバケット数
UpsertSession のコミット頻度: Delta Table の各パーティションでは、1 分あたり 1 つのコミットのみが許可されます。2 つのコミット間の期間が 1 分未満の場合、システムは
ErrorCode=FlowExceeded, ErrorMessage=CommitUpsert QPS Quota exceededというメッセージでエラーを報告します。
ストリームトンネルの制限
項目
制限
スロットへのデータ書き込み速度
10 MB/s
テーブルに同時に書き込まれるパーティション数
64
パーティションで使用可能な最大スロット数
32
同時フラッシュ数
スロットの同時実行制限のため、各フラッシュ操作は 1 つのスロットを占有します。
データアップロードの制限
各フィールドのサイズは、フィールドの制限を超えることはできません。詳細については、「データ型エディション」をご参照ください。
説明STRING 型のフィールドのサイズは、8 MB を超えることはできません。
アップロード中に、複数のデータエントリがパッケージファイルにパッケージ化されます。
データ転送サービスの専用リソースグループのネットワーク制限
仮想プライベートクラウド(VPC)経由のアクセスのみがサポートされています。インターネット経由のアクセスはサポートされていません。
データ転送は同じリージョン内でサポートされています。リージョン間のデータ転送はサポートされていません。
ネットワーク帯域幅は、データ転送のアップロード速度とダウンロード速度に大きく影響します。ほとんどの場合、速度は 1 MB/s から 20 MB/s の範囲です。アップロード速度が遅い場合は、マルチスレッドアップロード方式を使用できます。
データ転送サービスの共有リソースグループ
次の表に、プロジェクトレベルで異なるリージョンに割り当てることができる共有リソース(スロット)の最大数を示します。共有リソースは無料です。
サイト | リージョン | スロット数 |
中国 | 中国 (杭州) | 300 |
中国 | 中国東部 1 ファイナンス | 50 |
中国 | 中国 (上海) | 600 |
中国 | 中国東部 2 ファイナンス | 50 |
中国 | 中国 (北京) | 300 |
中国 | 中国北部 2 アリガバメント | 100 |
中国 | 中国 (張家口) | 300 |
中国 | 中国 (ウランチャブ) | 300 |
中国 | 中国 (深圳) | 150 |
中国 | 中国南部 1 ファイナンス | 50 |
中国 | 中国 (成都) | 150 |
中国 | 中国 (香港) | 50 |
アジア太平洋 | シンガポール | 100 |
アジア太平洋 | マレーシア (クアラルンプール) | 50 |
アジア太平洋 | インドネシア (ジャカルタ) | 50 |
アジア太平洋 | 日本 (東京) | 50 |
ヨーロッパおよびアメリカ | ドイツ (フランクフルト) | 50 |
ヨーロッパおよびアメリカ | 米国 (シリコンバレー) | 100 |
ヨーロッパおよびアメリカ | 米国 (バージニア) | 50 |
ヨーロッパおよびアメリカ | 英国 (ロンドン) | 50 |
中東およびインド | UAE (ドバイ) | 50 |
データ転送サービスの有効な状態コード
状態コード | 状態コード名 |
200 | HTTP_OK |
201 | HTTP_CREATED |
400 | HTTP_BAD_REQUEST |
401 | HTTP_UNAUTHORIZED |
403 | HTTP_FORBIDDEN |
404 | HTTP_NOT_FOUND |
405 | HTTP_METHOD_NOT_ALLOWED |
409 | HTTP_CONFLICT |
422 | HTTP_UNPROCESSABLE_ENTITY |
429 | HTTP_TOO_MANY_REQUESTS |
499 | HTTP_CLIENT_CLOSED_REQUEST |
500 | HTTP_INTERNAL_SERVER_ERROR |
502 | HTTP_BAD_GATEWAY |
503 | HTTP_SERVICE_UNAVAILABLE |
504 | HTTP_GATEWAY_TIME_OUT |
失敗したリクエストのリトライポリシー
リクエストが失敗した場合、クライアントは一定時間待機してからリクエストを再開する必要があります。
連続して失敗したリクエストの待機時間は指数関数的に増加する必要があります。最短の待機時間は 1 秒です。例: 1 秒、2 秒、4 秒、8 秒、16 秒、32 秒、32 秒。
繰り返しリクエスト
同じ URL を持つリクエスト。
同じ IP アドレスのクライアントによって連続して開始されるリクエスト。
有効なリクエスト
状態コードが有効で、リトライポリシーの要件を満たしているリクエスト。
無効なリクエスト
状態コードは有効ですが、リトライポリシーの要件を満たしていないリクエスト。
説明無効なリクエストは、サービスレベル契約(SLA)では保証されません。
攻撃リクエスト
状態コードが 429 と 503 で、リトライポリシーに準拠していないリクエスト。状態コード 429 と 503 は、プロセス制御のために返されます。
攻撃リクエストの場合、MaxCompute は攻撃を開始したクライアントの IP アドレス、UID、およびプロジェクトを分離します。分離されたオブジェクトは、想定どおりに MaxCompute にアクセスできません。
説明攻撃リクエストは、SLA では保証されません。
FAQ
データ転送の速度が低下するのはなぜですか?
サービスアーキテクチャの制限により、MaxCompute Tunnel サービスでリクエストのレイテンシが断続的に発生する場合があります。この場合、10 MB のデータの単一アップロードまたはダウンロードに費やされる時間が数秒から数分に増加する可能性があります。この問題は、次のシナリオで発生する可能性があります。
CPU やネットワーク帯域幅などの共有トンネルリソースが使い果たされている
期間: 数分から数時間。
サービスアーキテクチャの制限により、この問題を防ぐことはできません。トンネルリソースに対する要件が高い場合は、専用のトンネルリソースを購入できます。
クライアントからトンネルへのインターネット経由のデータのアップロードやダウンロードなどのネットワーク接続が不安定
期間: 評価できません。
インターネットの安定性は保証できません。ネットワークの安定性に対する要件が高い場合は、Alibaba Cloud VPC を使用することをお勧めします。
CPU やネットワーク帯域幅などのクライアントリソースがすべて使用されている
期間: 評価できません。
クライアントの物理リソースを完全に評価する必要があります。
アップロードとダウンロードに長時間かかる長時間の接続を使用する場合、クライアントのコードロジックが不適切
期間: 評価できません。
コードを設計する際には、データ転送のパフォーマンスを十分に考慮する必要があります。