概要
汎用中国語テキストアナライザー (chn_standard) は、中国語のセマンティクスに基づいてテキストをトークン化します。このアナライザーは、ネットワーク全体のあらゆる業種に適しています。検索単位は、テキスト分析に使用される最小粒度です。汎用中国語テキストアナライザーは、テキスト分析に検索単位を使用し、拡張分析をサポートしています。たとえば、ドキュメント内のフィールドの値が「菊花茶」の場合、分析結果は「菊花 茶 花茶」となり、「花茶」は「茶」の拡張用語です。
Example:
Original content: 菊花茶
Analysis result: 菊花 茶 花茶
テキスト分析への介入
汎用中国語テキストアナライザーによって返される分析結果に介入する場合は、詳細設定で chn_standard.dict 辞書を変更し、変更後の詳細設定を新しいバージョンとして公開します。介入エントリは、中粒度のエントリです。エンジンは、検索を実行するときに、介入エントリを検索単位に変換します。たとえば、「搜索引擎」を介入エントリとして辞書に追加します。ユーザーが「搜索引擎」を検索すると、エンジンは辞書内で一致を見つけ、介入エントリ「搜索引擎」を次の用語に変換し続けます。「搜索」と「引擎」。
使用上の注意
このアナライザーは、TEXT データ型のフィールドにのみ適用されます。アナライザーを使用するには、スキーマを構成するときに、アナライザーを chn_standard に設定します。