PAI-EAS は、さまざまなアクセス方法と 2 つの通信プロトコルを提供しており、ネットワークとパフォーマンスの要件に合わせて組み合わせることができます。
シナリオ
デフォルトでは、追加設定なしで、HTTP を使用して共有ゲートウェイ経由でデプロイ済みのサービスを呼び出すことができます。ユースケースに関連する情報をすばやく見つけるには、このガイドをご利用ください:
クイックスタート: デフォルトの共有ゲートウェイを使用してデプロイ済みのサービスを呼び出すには、「ゲートウェイ経由でのサービス呼び出し」をご参照ください。
他のアクセス方法の検討: 共有ゲートウェイがニーズを満たさない場合は、「アクセス方法の選択」をご参照ください。専用ゲートウェイ、VPC ダイレクト接続、Network Load Balancer (NLB)、サービスディスカバリ (Nacos) などの代替手段について説明しています。
gRPC の使用: gRPC バイナリプロトコルを使用してネットワークオーバーヘッドを削減し、推論パフォーマンスを向上させるには、「gRPC を使用した PAI-EAS 推論サービスの呼び出し」をご参照ください。
仕組み
PAI-EAS のサービス呼び出しのデータフローは次のとおりです:
クライアントリクエスト: アプリケーションは、PAI-EAS サービスのエンドポイント (ゲートウェイまたはダイレクト接続のアドレス) に推論リクエストを送信します。
エンドポイントのルーティング: エンドポイントは、選択したアクセス方法 (共有ゲートウェイ、専用ゲートウェイ、VPC ダイレクト接続、NLB、または Nacos) を介して、リクエストをバックエンドのサービスインスタンスにルーティングします。ゲートウェイベースの方法では、ゲートウェイレイヤーが負荷分散とルーティングを処理します。ダイレクト接続方法では、クライアントがターゲットのサービスインスタンスを選択します。
サービスインスタンスの処理: リクエストが PAI-EAS サービスインスタンスに到達すると、モデルサービングプロセスが推論計算を実行し、結果を JSON や ProtoBuf などの指定された形式にシリアル化してから返します。
クライアントのレスポンス受信: 推論結果を受信した後、クライアントはリクエストタイプに基づいてレスポンスデータを解析し、ビジネスロジックを続行します。
アクセス方法
選択するアクセス方法は、ネットワーク環境によって異なります。
方法 | ネットワークパス | 設定コスト | ユースケース |
共有ゲートウェイ経由のインターネットまたは Virtual Private Cloud (VPC) | 設定不要 | 迅速な検証と低トラフィックのサービス | |
専用ゲートウェイ経由のインターネットまたは VPC (VPC 間およびクラウド間のアクセスをサポート) | 作成が必要で、追加料金が発生します | 高いセキュリティ、安定性、およびトラフィック容量を必要とするサービス向け | |
ゲートウェイをバイパスして、同じ VPC 内のインスタンスに直接接続します | VPC 設定が必要 | 低レイテンシーおよび高同時実行のシナリオ | |
同じ VPC 内で NLB を介してトラフィックを転送します | NLB インスタンスの作成または関連付けが必要 | 負荷分散を伴う高トラフィック | |
同じ VPC 内で Nacos を使用して登録と検出を行います | 自己管理型の Nacos インスタンスが必要 | すでに Nacos をサービスガバナンスに使用している環境向け |
PAI-EAS サービス用に Virtual Private Cloud (VPC)、vSwitch、およびセキュリティグループを設定した後:
セキュリティグループルールの影響を受けない: 共有ゲートウェイまたは専用ゲートウェイを介したアクセスは、セキュリティグループルールの影響を受けません。ただし、専用ゲートウェイには許可リストを設定できます。
セキュリティグループルールの影響を受ける: NLB、Nacos、または VPC ダイレクト接続を介したアクセスは、セキュリティグループルールの対象となります。PAI-EAS からのすべてのアウトバウンドトラフィックも、これらのルールの対象となります。
サポートされる通信プロトコル
使用できるプロトコルは、サービスタイプによって異なります:
HTTP/JSON (デフォルト): デプロイメント後にデフォルトで有効になり、ほとんどのシナリオに適しています。
gRPC: パフォーマンス重視またはストリーミング推論のシナリオに適した、高性能なバイナリプロトコルです。デプロイメント時にこのプロトコルを手動で有効にする必要があります。