Content Moderation では、カスタムテキストライブラリを使用して、検出結果をビジネスニーズに合わせて調整できます。カスタムテキストライブラリは、画像内のテキストの違反検出、テキストのスパム対策、ファイルのスパム対策、音声のスパム対策などのシナリオに適用されます。これらのライブラリを使用して、ブロック、フィルタリング、または人間によるレビューが必要なテキストを管理し、新しいモデレーション要件に対応できます。
背景情報
カスタムテキストライブラリを使用する前に、このドキュメントをよくお読みいただき、テキストライブラリの動作を理解してください。これにより、不適切なキーワードの追加などの誤った設定を防ぎ、誤検出や検出精度への影響を回避できます。
カスタムテキストライブラリには、フィードバックベースのテキストライブラリと自己管理型のテキストライブラリがあります。
フィードバックベースのテキストライブラリは、人間によるレビュー記録から自動的に生成され、デフォルトで同じタイプのすべての検出シナリオに適用されます。このライブラリ内のテキストは管理できますが、ライブラリ自体を無効化または削除することはできません。人間によるレビューの詳細については、「人間によるレビュー」をご参照ください。
自己管理型のテキストライブラリは、特定の検出または検出シナリオのカテゴリに使用するために作成します。ライブラリ内のテキストだけでなく、ライブラリ自体も管理できます。
作成できる自己管理型のテキストライブラリは最大 10 個です。この制限には、フィードバックベースのテキストライブラリは含まれません。
このドキュメントでは、Content Moderation コンソールでカスタムテキストライブラリを管理する方法について説明します。コンソールの使用に加えて、API または SDK を使用してこれらの操作を実行することもできます。詳細については、次のドキュメントをご参照ください。
テキストタイプ
カスタムテキストライブラリには、キーワードと類似テキストの 2 種類のテキストを含めることができます。
キーワード
キーワードは、コンテンツ制御に使用される特定の短い単語またはフレーズです。テキストに事前定義されたキーワードが含まれている場合、一致がトリガーされます。ビジネスシナリオごとに異なるキーワードを設定できます。
Content Moderation では、画像内のテキストの違反検出とテキストのスパム対策のシナリオでキーワードを使用できます。シナリオによって設定が若干異なる場合があります。
中国語のキーワードは、AND (
&) および NOT (~) 論理演算子をサポートしています。例:「A&B」を定義した場合、テキストに「A」と「B」の両方が含まれている場合にのみ一致します。
「A~B」を定義した場合、テキストに「A」が含まれているが「B」が含まれていない場合にのみ一致します。テキストに「A」と「B」の両方が含まれている場合、一致はトリガーされません。
説明AND (
&) 演算子は NOT (~) 演算子より先に記述する必要があります。たとえば、「A&B~C」はキーワードとして設定できますが、「A~C&B」は設定できません。類似テキスト
類似テキスト機能は、文または段落間の意味的類似性を評価します。2 つのテキストは若干の違いがあっても、全体的な意味が同じであったり、同じ事象を説明していたりする場合があります。システムは、スキャンされたテキストが事前定義されたテキストサンプルと高い類似性を持つかどうかをチェックします。類似度スコアが特定のしきい値に達すると、一致がトリガーされます。
類似テキストライブラリは、テキストのスパム対策シナリオ用です。ビジネスに応じて、ブロックリスト、信頼リスト、レビューリストを定義できます。レビューリストには、人間によるレビューが必要なテキストが含まれます。ライブラリ内に関連するテキストサンプルを維持することで、これらのサンプルに一致するコンテンツをフィルタリングするようにテキストのスパム対策サービスを誘導できます。
制限事項
タイプ | 項目 | 制限 |
テキストライブラリ | ライブラリ数 | 自己管理型のテキストライブラリは最大 10 個です。 |
テキストライブラリ | ライブラリ名の長さ | 最大 20 文字です。 |
キーワード | キーワードタイプ |
|
キーワード | ライブラリあたりのキーワード数 | 最大 10,000 個です。 |
キーワード | キーワードの最大長 | 50 文字 (記号を含む) です。 |
キーワード | 中国語キーワードのエンコーディング | UTF-8 です。 |
キーワード | キーワード形式 | キーワードには、全角または半角形式の次の特殊文字を含めることはできません:
|
類似テキスト | 類似テキストの長さ | 20~4,000 文字です。 説明 誤検出を避けるため、テキストの長さを 200 文字以内にすることを推奨します。 |
類似テキスト | ライブラリあたりの類似テキストエントリ数 | 最大 10,000 個です。 |
類似テキスト | テキストエンコーディング形式 | UTF-8 です。 |
類似テキスト | 類似テキストのコンテンツ | テキストサンプルには、抽出可能で明確な中国語の意味的特徴が含まれている必要があります。分析エンジンがサンプルの特徴が少なすぎると判断した場合、そのサンプルは無視されます。 説明 たとえば、意味のない文字、数字、または各種絵文字のみで構成されるサンプルは無視される場合があります。 |
操作手順
Content Moderation コンソールにログインします。
左側のナビゲーションペインで、[マシン監査 V1.0] > Risk Libraries を選択します。
Custom Text Library タブで、Create Text Library をクリックします。
In the [Create Custom Text Library] dialog box, configure the parameters as described in Table 1, and then click [OK].
Table 1. Parameters for creating a custom text library
Parameter
Description
[Name]
The name of the text library. Duplicate names are allowed, but we recommend using a unique name for your business.
[Detection Scene]
The use case for the text library. Valid values:
[Text Anti-spam]: Applicable to text anti-spam (when the
scenesparameter includesantispam).[Texts or Objects on Image]: Applicable to image moderation (when the
scenesparameter includesad).
[Type]
The type of text in the library. Valid values:
[Text]: Uses keyword matching. Triggers a match if the content contains a keyword. This provides broad coverage.
[Similar Text]: Uses text similarity matching. Triggers a match only if the entire segment of text is similar to a sample. This provides high precision.
説明This option is available only when [Detection Scene] is set to [Text Anti-spam].
[Match Mode]
When [Type] is set to [Text], select the match mode for the library. Valid values:
[Precise]: A match is triggered only if the scanned text contains content that is identical to a keyword in the library.
[Check after Preprocess Texts ]: Normalizes the scanned text and keywords before matching. The normalization logic is as follows:
Uppercase letters are converted to lowercase. For example, if the input text is "bitCoin", it will match the keyword "bitcoin".
Traditional Chinese characters are uniformly converted to Simplified Chinese characters. For example, if you enter the text "中國", it will match the keyword "中国".
Visually similar characters are converted. For example, the input text "②" will match the keyword "2".
説明For a similar text library, match after normalization is used by default.
[Suggestion]
The purpose of the text library.
If [Type] is [Text], valid values are:
[Block list]: If a match is found, the automated review result is
suggestion=block.[Review List]: If a match is found, the automated review result is
suggestion=review.[Filter List]: Keywords in this list are ignored, but other content is still scanned.
If [Type] is [Similar Text], valid values are:
[Block list]: If a match is found, the automated review result is
suggestion=block.[Review List]: If a match is found, the automated review result is
suggestion=review.[Trust list]: If a match is found, the automated review result is
suggestion=pass.
BizType
The
BizTypeparameter allows you to configure and apply different text libraries for different business requirements, such as specifying a text library for a specific detection. The logic is as follows:If you set
BizTypeto "A" for a text library and also passBizType="A"in your API request, the detection uses only enabled libraries with thatBizType.Otherwise, the detection uses all enabled text libraries.
After you create the text library, it appears in the text library list.
テキストライブラリ内のコンテンツ (キーワードまたは類似テキスト) を管理します。
Custom Text Library リストには、すべてのカスタムテキストライブラリが表示されます。フィードバックベースのテキストライブラリは、System タグで識別され、命名形式
SCENE_FEEDBACK_WHITE/BLACKに従います。たとえば、ANTISPAM_FEEDBACK_BLACK は、テキストアンチスパムシナリオ用にシステムによって生成されたブロックリストです。管理するライブラリを見つけ、操作列のModifyをクリックします。
Text Libraries ページで、ライブラリ内のキーワードを管理します。
Text Libraries ページには、追加されたすべてのキーワードと、Detected in Last Seven Days 列のヒット数が表示されます。この数には当日は含まれません。
説明キーワードを追加または削除すると、変更は約 15 分後に有効になります。
Add Keyword または Import をクリックし、画面の指示に従ってライブラリにキーワードを追加します。
キーワードを削除するには、削除するキーワードを選択し、Batch Delete をクリックします。また、個々のキーワードの横にある Delete をクリックして削除することもできます。
関連操作
セルフマネージドテキストライブラリについては、Custom Text Library ページの Actions 列で Delete、Modify、または Disable をクリックしてライブラリを管理できます。