Realtime Compute for Apache Flink デプロイメントを開始する前に、デプロイメントを構成する必要があります。このトピックでは、デプロイメントを構成する方法について説明します。
前提条件
Realtime Compute for Apache Flink コンソールで名前空間にアクセスし、デプロイメントリソース構成などの操作を実行するために使用する Alibaba Cloud アカウントまたは RAM ユーザーに必要な権限が付与されています。詳細については、「名前空間に対する権限を付与する」をご参照ください。
デプロイメントが作成されています。詳細については、「デプロイメントを作成する」をご参照ください。
手順
管理したいワークスペースを見つけ、[アクション] 列の [コンソール] をクリックします。
左側のナビゲーションウィンドウで、 を選択します。[デプロイメント] ページで、管理する開発の名前をクリックします。
[構成] タブで、パラメーターを構成するセクションを見つけ、右上隅にある [編集] をクリックします。
説明デプロイメントの基本構成を構成する場合は、 ページに戻って、デプロイメントを編集およびデプロイする必要があります。[基本] セクションの右上隅にある [編集] をクリックすると、メッセージが表示されます。デプロイメントを編集する場合は、[OK] をクリックします。
デプロイの構成を変更します。
構成が完了したら、[保存] をクリックします。
基本
デプロイメントの種類 | 説明 |
SQL デプロイメント | SQL コードを記述し、[エンジンバージョン]、[追加の依存関係]、[説明]、[ラベル] パラメーターを構成できます。パラメーターの詳細については、「SQL ドラフトを作成する」をご参照ください。 説明 [基本] セクションの右上隅にある [編集] をクリックすると、メッセージが表示されます。デプロイメント構成を変更する場合は、[OK] をクリックします。その後、SQL エディターページにリダイレクトされ、デプロイメントを編集およびデプロイできます。 |
JAR デプロイメント | [エンジンバージョン]、[JAR URI]、[エントリポイントクラス]、[エントリポイントのメイン引数]、[追加の依存関係]、[説明]、[kerberos 名]、[ラベル] パラメーターを構成できます。パラメーターの詳細については、「デプロイメントを作成する」をご参照ください。 |
Python デプロイメント | [エンジンバージョン]、[python URI]、[エントリモジュール]、[エントリポイントのメイン引数]、[python ライブラリ]、[python アーカイブ]、[追加の依存関係]、[説明]、[kerberos 名]、[ラベル] パラメーターを構成できます。パラメーターの詳細については、「デプロイメントを作成する」をご参照ください。 |
パラメーター
パラメーター | 説明 |
チェックポイント間隔 | チェックポイントが生成される間隔。このパラメーターを構成しない場合、チェックポイント機能は無効になります。 |
チェックポイントのタイムアウト時間 | デフォルト値: 10 。単位:分。このパラメーターで指定された時間内にチェックポイントが生成されない場合、チェックポイントの生成は失敗します。 |
チェックポイント間の最小間隔 | 2 つのチェックポイント間の最小間隔。チェックポイントの最大並列度が 1 の場合、このパラメーターは 2 つのチェックポイント間の最小間隔を指定します。 |
状態の有効期限 | デプロイメントの状態データの生存時間( TTL )。デフォルト値: 36 h 。デフォルト値は、デプロイメントの状態データが 36 時間後に期限切れになることを示します。システムは期限切れのデータを自動的に削除します。 重要 デフォルト値は、Alibaba Cloud のベストプラクティスに基づいて決定されます。このデフォルト値は、Apache Flink によって提供される TTL のデフォルト値とは異なります。Apache Flink によって提供される TTL のデフォルト値は 0 で、これは状態データが期限切れにならないことを示します。 データが初めてシステムに入り処理されると、データは状態バックエンドメモリに格納されます。同じプライマリキー値を持つデータがシステムに入ると、システムは格納された状態データに基づいてデータ計算を実行し、データのアクセス時間を更新します。このプロセスは Realtime Compute for Apache Flink のコアであり、継続的に処理されるストリーミングデータに依存しています。指定された TTL 内にデータが再度アクセスされない場合、システムはデータを期限切れのデータと見なし、状態バックエンドストレージからデータを削除します。 正確なデータ計算と期限切れデータのタイムリーな削除を確実にするために、TTL を適切に構成する必要があります。これにより、状態バックエンドメモリの使用量が削減され、システムメモリの負担が軽減され、計算効率とシステムの安定性が向上します。 |
Flink 再起動ポリシー | ジョブの再起動動作は、ジョブの再起動ポリシーとタスクの失敗回復ポリシーの 2 つのポリシーによって決まります。 ジョブ再起動ポリシー このポリシーは、障害発生後にジョブ全体が再起動を試行するかどうかを制御します。
ジョブ再起動ポリシーの明示的な構成 これらのポリシーのいずれかを設定して、デフォルトの動作を上書きします:
タスク失敗回復ポリシー このポリシーは、ジョブ内の個々のタスクが失敗後にどのように再起動されるかを制御します。これは、[その他の構成] セクションの
詳細については、Apache Flink ドキュメントの「タスク失敗回復」をご参照ください。 説明 タスクが失敗し、フェールオーバー戦略が |
その他の構成 | その他の Realtime Compute for Apache Flink 設定。たとえば、 |
ログ記録
パラメーター | 説明 |
ログのアーカイブ | ログのアーカイブを有効にするかどうかを指定します。デフォルトでは、[ログアーカイブを許可] がオンになっています。[ログ記録] セクションで [ログアーカイブを許可] をオンにすると、[ログ] タブで履歴デプロイメントのログを表示できます。詳細については、「履歴デプロイメントのログを表示する」をご参照ください。 説明
|
ログアーカイブの有効期限 | アーカイブされたログファイルの検証期間。デフォルトでは、アーカイブされたログファイルは 7 日間有効です。 |
ルートログレベル | ルートログレベル。緊急度の低い順にリストされている次のレベルのいずれかを指定できます。
|
ログレベル | ログ名とログレベル。 |
ログ記録プロファイル | 使用するログテンプレート。ドロップダウンリストからデフォルトまたはカスタムテンプレートを選択できます。[カスタムテンプレート] を選択した場合は、ログを他のストレージサービスにエクスポートできます。詳細については、「デプロイメントのログをエクスポートするためのパラメーターを構成する」をご参照ください。 |
参照
オペレーターの状態データの TTL を構成して、状態データのサイズを制御できます。これにより、大量の状態データを持つデプロイメントのリソース消費が削減されます。詳細については、「ヒント」トピックの「状態 TTL ヒント」セクションをご参照ください。
このトピックで説明されているログパラメーター構成は、単一のデプロイメントの構成です。名前空間内のすべてのデプロイメントのログをエクスポートするためのパラメーターを構成する方法の詳細については、「デプロイメントのログをエクスポートするためのパラメーターを構成する」トピックの「名前空間内のすべてのデプロイメントのログをエクスポートするためのパラメーターを構成する」セクションをご参照ください。