すべてのプロダクト
Search
ドキュメントセンター

OpenSearch:ストップワードフィルタリング

最終更新日:Dec 28, 2024

概要

検索クエリ内の無意味な単語は、組み込みのストップワード辞書に基づいて除外されます。無意味な単語とは、頻出するものの検索結果に影響を与えない単語のことで、句読点や助動詞などが該当します。たとえば、検索クエリを Running!Man に設定した場合、データ取得時に感嘆符 (!) は除外されます。別の例として、検索クエリを Did you eat に設定した場合、助動詞の Did はデータ取得時に除外されます。

手順

1. OpenSearch コンソールにログオンします。左側のナビゲーションペインで、検索設定をクリックします。「基本設定」ページの左側のペインで、クエリ分析ルール設定をクリックします。「クエリ分析ルール設定」ページで、アプリケーションとアプリケーションのオンラインまたはオフラインバージョンを選択し、作成をクリックします。

image

2. ルール作成パネルで、ルール名、インデックス範囲、業種タイプのパラメーターを設定し、ストップワードを選択して、OK をクリックします。image

:ストップワードフィルタリングの介入辞書が指定されていない場合、ストップワードは組み込みのストップワード辞書に基づいて除外されます。特定されたストップワードが無効である場合、または特定のストップワードが組み込みのストップワード辞書に基づいて特定されない場合は、介入辞書を指定します。詳細については、このトピックの「ストップワードフィルタリングの介入辞書」セクションを参照してください。

3. ルールが作成されたら、「検索テスト」をクリックして検索テストを実行します。

image次の図は、テスト結果を示しています。image

クエリ分析のプロセスを確認します。image

4. クエリ分析のプロセスが正しいことを確認したら、「クエリ分析ルール設定」ページでインデックス方向をクリックします。次に、作成したクエリ分析ルールをデフォルトのクエリ分析ルールとして設定します。

image

5. デフォルトのクエリ分析ルールを確認します。

image

ストップワードフィルタリングの介入辞書

ストップワードはビジネスシナリオによって異なります。特定のストップワードが組み込みのストップワード辞書に存在しない場合や、組み込みのストップワード辞書に無効なストップワードが含まれている場合があります。この問題を解決するために、OpenSearch ではストップワードをカスタマイズできます。ストップワードフィルタリングの介入辞書を作成した後、クエリ分析ルールを作成または変更するときに介入辞書を指定して、ストップワードフィルタリングに介入できます。詳細については、ストップワードフィルタリングの介入辞書を参照してください。