すべてのプロダクト
Search
ドキュメントセンター

:汎用中国語テキストアナライザー

最終更新日:Dec 28, 2024

概要

汎用中国語テキストアナライザー (chn_standard) は、中国語のセマンティクスに基づいてテキストをトークン化します。このアナライザーは、ネットワーク全体のすべての業界に適しています。検索単位は、テキスト分析に使用される最小粒度です。汎用中国語テキストアナライザーは、テキスト分析に検索単位を使用し、拡張分析をサポートしています。たとえば、ドキュメント内のフィールドの値が「菊花茶」の場合、分析結果は「菊花 茶 花茶」となり、「花茶」は「茶」の拡張用語です。

Example: // 例:
Original content: 菊花茶  // 元のコンテンツ:菊花茶
Analysis result: 菊花  茶 花茶 // 分析結果:菊花 茶 花茶

テキスト分析への介入

汎用中国語テキストアナライザーによって返される分析結果に介入する場合は、詳細設定で chn_standard.dict 辞書を変更し、変更後の詳細設定を新しいバージョンとして公開します。介入エントリは、中粒度のエントリです。OpenSearch Vector Search Edition は、検索を実行するときに、介入エントリを検索単位に変換します。たとえば、「搜索引擎」を介入エントリとして辞書に追加します。ユーザーが「搜索引擎」を検索すると、OpenSearch Vector Search Edition は辞書内で一致を見つけ、介入エントリ「搜索引擎」を次の用語に変換し続けます。「搜索」と「引擎」。

使用上の注意

  • このアナライザーは、TEXT データ型のフィールドにのみ適用されます。アナライザーを使用するには、スキーマを構成するときにアナライザーを chn_standard に設定します。