このトピックでは、アップストリームシステムまたはダウンストリームシステムのスケーリング時のコネクタの動作と対処方法、および必要な注意事項について説明します。
コネクタの動作と推奨される操作
タスクの失敗や頂点のダウンタイムなどのエラーが発生した場合、Realtime Compute for Apache Flink はフェールオーバーを実行し、ジョブを自動的に復旧します。 正常な状態にジョブを復旧することを目的とし、正確で一貫性のあるデータ処理結果を保証します。
コネクタ | コネクタの動作 | 推奨される操作 | チェックポイントに依存するシンクへの書き込み? |
Kafka パーティションが追加されると、Realtime Compute for Apache Flink はこの変更を動的に検出します。 ただし、新しいパーティション数が並列度の整数倍でない場合、データは均等に分散されません。 | Kafka パーティションを追加した後、データが均等に分散されるように、ジョブの並列度をパーティション数の約数に調整します。 たとえば、Kafka パーティション数が 3 から 8 に増加した場合は、並列度を 4 または 8 に変更します。 | はい、厳密に 1 回の配信の場合 | |
インスタンスのスケーリングまたは再起動中に、接続が中断される場合があります。 この場合、Realtime Compute for Apache Flink はタイムアウトになるまで接続の再確立を試みます。 その後、Hologres インスタンスが再起動されるまで、フェールオーバーの試行を行います。 | Realtime Compute for Apache Flink はテーブル名に基づいて Hologres テーブルを読み取るため、ステートレス起動を実行します。 | いいえ | |
| フェールオーバー後、ジョブはパーティション数の変更に適応します。 ジョブのフェールオーバーを防ぐために、パーティション数を変更した後にジョブを手動で再起動できます。 | いいえ | |
インスタンスのスケーリングまたは再起動により、接続が中断される場合があります。 この場合、Realtime Compute for Apache Flink は切断を検出し、タスクを再起動します。 データベースエンドポイントが変更されておらず、データベースサービスが引き続き利用可能な場合、コネクタはジョブを復旧するために接続の再作成を試みます。 説明 仕組み 一般に、外部システムに障害が発生した場合、これらのコネクタは最初に再接続を試みます。 これらの試みが成功した場合、ジョブはフェールオーバーをトリガーせずに続行されます。 ただし、外部システムが長期間利用できないためにすべての試みが失敗した場合、コネクタは例外をスローし、タスクの失敗を引き起こします。 その後、Realtime Compute for Apache Flink はフェールオーバーし、事前定義された戦略に基づいてジョブを復旧します。 復旧後、タスクは再編成され、コネクタは外部システムとの接続の再作成を試みます。 | スケーリング操作を実行する前に、ジョブの再起動の影響を評価します。
説明 プライマリ - セカンダリスイッチオーバーまたはクラスタの再起動により、一時的な接続の中断が発生する可能性があります。 長期間接続が復旧しない場合は、フェールオーバーがトリガーされます。 これを回避するには、構成の変更が完了した後にジョブをキャンセルして再起動します。 | いいえ | |
いいえ | |||
いいえ | |||
いいえ | |||
いいえ | |||
いいえ | |||
いいえ | |||
いいえ | |||
いいえ | |||
いいえ | |||
該当なし | |||
はい | |||
はい、厳密に 1 回の配信の場合 | |||
スケールダウン操作後、MaxCompute に現在のジョブの並列度で Realtime Compute for Apache Flink にデータを書き込んだり、Realtime Compute for Apache Flink からデータを読み取ったりするための十分な計算リソースがない場合、影響を受けるサブタスクはリソースが利用可能になるまでエラーをスローします。 | スケールダウンを実行する前に、データトラフィックを慎重に評価します。 あるいは、ジョブの並列度を減らします。 | バッチトンネルモード はい | |
コネクタはパーティション数の変更を自動的に検出できません。 | 変更に適応するために、ジョブを手動で再起動します。 | いいえ | |
|
| いいえ | |
いいえ | |||
true に設定されている場合は、 |
| いいえ | |
| 自動適応により、データ消費が繰り返される場合があります。 これが許容できない場合は、パーティション数を変更する前にジョブをキャンセルします。 変更が完了したら、最後のチェックポイントからジョブを再起動します。 | はい | |
コネクタにデータが存在しないか、バッファによって送信されます。 | 該当なし | はい | |
データの書き込みは影響を受けません。 | 該当なし | いいえ | |
データ読み取りステージ中に、トポロジの変更により | 操作によってトポロジが変更される場合は、最初にジョブをキャンセルし、操作が完了してクラスタが正常に戻ったときにジョブを再起動することをお勧めします。 | はい | |
データ構造とステータスを記述するために独立したメタデータ層が維持されており、これらのシステムのスケーリングは含まれていないため、該当しません。 | 該当なし | はい | |
該当なし | はい | ||
該当なし | はい | ||
該当なし | はい | ||
これらのコネクタはテスト専用に使用されるため、該当しません。 | 該当なし | 該当なし | |
該当なし | 該当なし | ||
該当なし | 該当なし | ||
該当なし | 該当なし |