AI Gateway を使用すると、API レベルでポリシーを追加し、プラグインを構成して、API のセキュリティ、パフォーマンス、保守性を向上させることができます。
ポリシー構成の変更はすぐに有効になります。API を再公開する必要はありません。
手順
AI Gateway [インスタンス] に移動し、リージョンを選択して、ターゲットの [インスタンス ID] をクリックします。
左側のナビゲーションウィンドウで、[LLM API] をクリックします。次に、API の名前をクリックして API 詳細ページに移動します。
[ポリシーとプラグイン] タブをクリックします。[その他のポリシーとプラグイン] セクションで、ポリシーまたはプラグインを構成する場所 ([インバウンド処理] または [アウトバウンド処理]) を選択し、[ポリシー/プラグインを有効化] をクリックします。
[ポリシー/プラグインを有効化] パネルで、ポリシーまたはプラグインを選択して構成します。詳細については、「ポリシー構成」および「プラグイン構成」をご参照ください。
ポリシー構成
同時実行制御
同時実行制御ルールは、ゲートウェイによって処理されているリクエストの総数をカウントします。この数が指定されたしきい値に達すると、ゲートウェイは直ちにトラフィックをブロックします。このしきい値は、バックエンドサービスが処理できる同時リクエストの最大数に設定できます。これにより、高い同時実行性の期間中にバックエンドサービスの可用性が保護されます。
トラフィックシェーピング
トラフィックシェーピングルールは、API の 1 秒あたりのクエリ数 (QPS) をモニターします。QPS が指定されたしきい値に達すると、ゲートウェイは直ちにトラフィックをブロックします。これにより、突然のトラフィックスパイクによるバックエンドサービスの過負荷を防ぎ、高可用性を確保します。
サーキットブレーカーポリシー
サーキットブレーカーポリシーは、API の応答時間またはエラー率をモニターします。しきい値に達すると、ゲートウェイは直ちにサーキットをトリップします。指定された期間、ゲートウェイは不安定なリソースの呼び出しを停止します。これにより、バックエンドサービスへの影響を防ぎ、高可用性を確保します。指定された時間が経過すると、ゲートウェイはリソースへの呼び出しを再開します。
IP ブラックリストおよびホワイトリストポリシー
IP ブラックリストおよびホワイトリストポリシーは、事前に構成された許可 (ホワイトリスト) または拒否 (ブラックリスト) された IP アドレスのリストに基づいて、クライアントのサービスへのアクセスを制御します。
タイムアウトポリシー
AI Gateway は API レベルのタイムアウト設定を提供します。特定の API について、ゲートウェイがバックエンドサービスからの応答を待つ最大時間を構成できます。指定された時間内にゲートウェイがバックエンドサービスから応答を受信しない場合、クライアントに HTTP ステータスコード 504 (ゲートウェイタイムアウト) を返します。
リトライポリシー
AI Gateway は API レベルのリトライ設定を提供し、失敗したリクエストを自動的にリトライできます。接続の失敗、利用できないバックエンドサービス、特定の HTTP ステータスコードなど、リトライをトリガーする条件を構成できます。
ヘッダー変更ポリシー
ヘッダー変更機能を使用すると、元のリクエストがバックエンドサービスに転送される前にヘッダーを変更したり、バックエンドサービスからの応答がクライアントに返される前にヘッダーを変更したりできます。
プラグイン構成
[プラグインの追加] タブをクリックします。
[クイックナビゲーション] セクションで、インストールするプラグインのタイプを選択するか、名前でプラグインを検索し、プラグインカードをクリックします:
プラグインがインストールされていない場合は、表示されるダイアログボックスで [インストールして構成] をクリックします。次に、プラグインルールを構成し、ステータスを有効に設定します。
プラグインが既にインストールされている場合は、表示されるダイアログボックスでプラグインルールを構成し、ステータスを有効に設定します。
[OK] をクリックします。API 添付ファイルリストにリダイレクトされ、API のプラグインの添付ファイルと有効ステータスを表示できます。
