Elasticsearch/OpenSearch データを Simple Log Service にインポートする方法 - Simple Log Service

前提条件

Elasticsearch/OpenSearch クラスターが利用可能であること。
プロジェクトと Logstore が作成済みであること。詳細については、「プロジェクトの管理」および「基本的な Logstore の作成」をご参照ください。

サポートバージョン

Elasticsearch 6.3 以降および OpenSearch 1.0.0 以降のみをサポートしています。

データインポート設定の作成

Log Serviceコンソールにログインします。
データのインポート セクションで、データのインポート タブをクリックし、[ES/OpenSearch - データインポート] を選択します。
プロジェクトとLogstoreを選択します。そして、[次へ] をクリックします。

インポート設定を行います。

インポート設定 ステップで、以下のパラメーターを設定します。

パラメーター	説明
[タスク名]	インポートジョブの一意の名前。
[表示名]	ジョブの表示名。
[ジョブの説明]	インポートジョブの説明。
[サービスインスタンスの URL]	Elasticsearch/OpenSearch サーバーの URL を `http://host:port/` の形式で入力してください。複数の URL は、たとえば `http://host1:port1/,http://host2:port2/` のように、カンマ (,) で区切って指定できます。 Elasticsearch/OpenSearch のデフォルトのサービスポートは 9200 です。重要 VPC ベースのインスタンス ID を設定する場合、`host` を対応する ECS インスタンスの IPv4 アドレスに設定する必要があります。
[インデックスリスト]	インポートするインデックス。複数のインデックス名はコンマ (,) で区切ります。例: `index1,index2,index3`。
[ユーザー名]	Elasticsearch/OpenSearch クラスターにアクセスするためのユーザー名。クラスターが認証を使用する場合にのみ必要です。
[ユーザーパスワード]	Elasticsearch/OpenSearch クラスターにアクセスするためのパスワード。
[時間]	ソースインデックス内の時間を表すフィールドで、ログ時間として使用します。時間フィールドを指定しない場合、SLS はデータがインポートされたときのシステム時刻をログ時間として使用します。重要増分インポートを実行するには、時間を設定する必要があります。
[時刻フィールドの形式]	時間フィールドの値を解析するために使用する時間形式。 Java の SimpleDateFormat 構文に従う時間形式をサポートします (例: yyyy-MM-dd HH:mm:ss)。構文の詳細については、「Class SimpleDateFormat」をご参照ください。一般的な時間形式については、「時間形式」をご参照ください。エポック形式をサポートします。有効値：epoch、epochMillis、epochMicro、epochNano。重要 Java の SimpleDateFormat は UNIX タイムスタンプをサポートしていません。UNIX タイムスタンプを使用する場合は、時刻フィールドの形式を epoch 形式に設定する必要があります。
[タイムゾーン]	時間フィールドのタイムゾーン。時刻フィールドの形式がエポック形式に設定されている場合、タイムゾーンを設定する必要はありません。
[照会]	データをフィルターするために使用される検索クエリです。クエリは Elasticsearch/OpenSearch の query_string 形式に従う必要があります。例: `gender:male and city:Shanghai`。詳細については、「クエリ文字列クエリ」をご参照ください。
[インポートモード]	データのインポートに使用する方法。 [履歴データのみインポートする]：データのインポート後にジョブは自動的に停止します。 [新規データを自動的にインポートする]：インポートジョブは継続的に実行されます。重要新規データを自動的にインポートするを選択した場合、時間を設定する必要があります。
[開始日時]	インポートの開始時刻。SLS は、タイムスタンプがこの時刻以降のデータのみをインポートします。重要このパラメーターは、時間が設定されている場合にのみ有効になります。
[終了時間]	インポートの終了時刻。SLS は、タイムスタンプがこの時刻以前のデータのみをインポートします。重要このパラメーターは、時間が設定され、かつインポートモードが履歴データのみインポートするに設定されている場合にのみ有効になります。
[最大データ遅延秒数]	データの生成からソースクラスターへの取り込みまでの最大許容レイテンシー (秒単位)。重要この値を実際のレイテンシーより低く設定すると、データが失われる可能性があります。このパラメーターは、時間が設定され、インポートモードが新規データを自動的にインポートするに設定されている場合にのみ有効になります。
[新しいデータの期間をチェックする (秒)]	Elasticsearch/OpenSearch の新しいデータをチェックする間隔 (秒単位)。デフォルト値：300。最小値：60。
[VPC ベースのインスタンス ID]	ソースが VPC (Alibaba Cloud Elasticsearch/OpenSearch クラスターまたは ECS インスタンス上のセルフホストクラスター) 内にある場合、SLS が内部ネットワーク経由でデータを読み取り、セキュリティと安定性を向上させるためにこのパラメーターを設定します。重要 Elasticsearch/OpenSearch クラスターは、100.104.0.0/16 CIDR ブロックからのアクセスを許可する必要があります。

プレビュー をクリックしてインポート結果をプレビューします。
設定を確認したら、次へをクリックします。

データのプレビュー と [インデックス作成] の設定を行い、次へをクリックします。 Simple Log Service は、デフォルトで全文インデックスを有効にします。また、収集されたログに基づいて手動でフィールドインデックスを作成するか、自動インデックスの生成 をクリックすると、Simple Log Service が自動的にフィールドインデックスを生成します。詳細については、「インデックスの作成」をご参照ください。

重要
すべてのログフィールドをクエリするには、全文インデックスを使用します。特定のフィールドをクエリしたり、インデックスのトラフィックを削減したり、SELECT 文で分析を実行したりするには、フィールドインデックスを使用します。
[クエリログ] をクリックします。次に、Logstoreのクエリと分析ページにリダイレクトされます。
インデックスが有効になるまで約1分待つ必要があります。次に、収集したログを [生ログ] タブで表示できます。ログのクエリと分析方法の詳細については、「ログのクエリと分析」をご参照ください。

データインポート設定の表示

データインポート設定を作成した後、コンソールでその詳細と生成されたレポートを表示できます。

インポート先のプロジェクトをクリックします。
インポート先の Logstore のナビゲーションペインで、データのインポート > データのインポート を選択し、設定名をクリックします。
インポート設定の概要 ページで、設定の基本情報とレポートを表示します。

よくある質問

問題	考えられる原因	解決策
プレビュー中に Elasticsearch/OpenSearch 接続エラー (`failed to connect`) が発生する。	Elasticsearch/OpenSearch サーバーの URL が正しくない。インポートサービスが使用する IP アドレスを IP アドレスホワイトリストに追加していないため、インポートサービスが Elasticsearch/OpenSearch クラスターにアクセスできない。 Alibaba Cloud 上にデプロイされた Elasticsearch/OpenSearch クラスターからデータをインポートする際に、VPC ID を設定していない。	Elasticsearch/OpenSearch サーバーの URL が正しいことを確認します。 IP アドレスを IP アドレスホワイトリストに追加して、インポートサービスがクラスターに接続できるようにします。詳細については、「IP アドレスホワイトリスト」をご参照ください。 Alibaba Cloud がホストする Elasticsearch/OpenSearch クラスターから内部ネットワーク経由でデータをインポートする場合は、VPC ID が設定されていることを確認します。
プレビュー中にタイムアウトエラー (`preview request timed out`) が発生する。	ソースインデックスが空であるか、フィルター条件に一致するデータが含まれていない。	インデックスにデータが含まれていない場合は、インデックスにデータを書き込んでから再度プレビューします。時間フィールドと時間形式を設定する際は、データ内の実際の時間フィールドと形式に一致していることを確認します。 Elasticsearch/OpenSearch の検索条件または時間範囲を設定する際は、インデックスに一致するデータが含まれていることを確認します。
SLS に表示されるログ時間が実際のデータ時間と一致しない。	ログの時間フィールドを指定していないか、インポート設定で時間形式またはタイムゾーンを正しく設定していない。	ログの時間フィールドを指定し、正しい時間形式とタイムゾーンを設定します。詳細については、「データインポート設定の作成」をご参照ください。
インポート後にデータをクエリまたは分析できない。	データがクエリの時間範囲外である。 Logstore のインデックスを作成していない。インデックスがまだ有効になっていない。	クエリしたいデータの時刻が、指定したクエリ時間範囲内にあるかどうかを確認します。範囲外の場合は、時間範囲を調整して再度クエリを実行します。 Logstore のインデックスを作成したかどうかを確認します。作成していない場合は、まずインデックスを作成します。詳細については、「インデックスの作成」および「インデックスの再作成」をご参照ください。インデックスが設定されており、[データ処理インサイト] ダッシュボードに表示されるインポートされたデータ量が期待どおりの場合、インデックスが有効になっていないことが原因と考えられます。再インデックスの作成をお試しください。詳細については、「再インデックス」をご参照ください。
インポートされたデータエントリの数が期待より少ない。	一部の Elasticsearch/OpenSearch ドキュメントは 3 MB を超えています。このことは、[データ処理インサイト] ダッシュボードで確認できます。	個々の Elasticsearch/OpenSearch ドキュメントのサイズを小さくします。
増分インポートが有効になっている場合、新しいデータのインポートに大幅なレイテンシーが発生する。	最大データ遅延秒数の値が大きすぎます。 Elasticsearch/OpenSearch クラスターの帯域幅が上限に達している。パブリックネットワーク経由でデータをインポートする際にネットワークが不安定である。 Logstore のシャードが少なすぎる。その他の考えられる原因については、「パフォーマンス制限」をご参照ください。	最大データ遅延秒数に適切な値を設定し、実際のレイテンシーに基づいて調整してください。 Elasticsearch/OpenSearch クラスターのトラフィックが帯域幅の上限に達していないか確認します (特に Alibaba Cloud がホストするクラスターの場合)。上限に達している場合は、帯域幅を増やします。パブリックネットワーク経由で Elasticsearch/OpenSearch データをインポートする場合は、十分な帯域幅があることを確認します。 Logstore のシャードが少ない場合は、シャードの数を増やしてレイテンシーを監視してみてください。詳細については、「シャードの管理」をご参照ください。

エラー処理

エラー

説明

Elasticsearch/OpenSearch クラスターとの通信エラー

インポートジョブは、デフォルトのキープアライブ期間 (24 時間) で、スクロールモードで Elasticsearch/OpenSearch データをプルします。ネットワーク接続エラーやその他の問題 (認証失敗など) により Elasticsearch/OpenSearch との正常な通信が妨げられた場合、インポートジョブは自動的に再試行します。

接続が 24 時間以内に復旧しない場合、ソースサーバーはスクロールセッションをクリアします。インポートジョブは "No search context found" エラーで失敗し、再作成が必要です。

Simple Log Service:Elasticsearch/OpenSearch データのインポート