Text Moderation 拡張版 2.0 多言語 PLUS サービス - AI Guardrails

Text Moderation 2.0 は、アップグレードされた多言語モデル機能を備えています。言語を自動的に識別し、より広範な言語をサポートします。国際的なビジネスシナリオに合わせたモデレーションポリシーとタグシステムを提供します。このトピックでは、Text Moderation 2.0 多言語サービスの特徴と使用方法について説明します。

特徴

Text Moderation 1.0 の多言語モデレーションサービスと比較して、Text Moderation 2.0 は、独立したポリシーとタグシステムを使用して、国際的なビジネス要件を満たします。また、ビジネス運用を簡素化し、手動レビューを支援するためのより多くの機能を提供します。

比較項目	Text Moderation 2.0	Text Moderation 1.0
多言語機能	38 言語をサポートします。	18 言語をサポートします。
モデレーション機能	複数のモデルを並行して使用します。ポリシーは、言語とリージョンの属性に基づいているため、より正確です。	単一のモデルを使用します。ポリシーは、言語属性に基づいて精度と再現率のバランスを取ります。
タグシステム	国際化されたタグシステムを使用します。profanity や regional などの国際化されたタグを追加し、複数のリスクタグとサブタグをサポートします。	中国語のシナリオ用のタグシステムを使用し、単一のリスクタグのみをサポートします。
検出範囲	コンソールですべての検出範囲を設定し、必要に応じて有効または無効にできます。設定は検出結果に直接マッピングされます。	一般的な検出範囲をサポートしますが、検出結果に直接マッピングされません。
API の特徴	サービスが自動的に識別できるため、入力言語を指定する必要はありません。モデレーション後、サービスは言語タイプと翻訳された英語のコンテンツを返し、手動レビューを支援します。	入力言語を指定する必要があります。サービスは翻訳されたコンテンツを返しません。

サポートされる言語

Text Moderation 2.0 多言語サービスは 38 言語をサポートします。

言語タイプ	英語名	言語コード
英語	English	en
簡体字中国語	Chinese	zh
繁体字中国語	Traditional Chinese	zh-tw
インドネシア語	Indonesian	id
マレー語	Malay	ms
タイ語	Thai	th
ベトナム語	Vietnamese	vi
タガログ語	Tagalog	tl
ヒンディー語	Hindi	hi
アラビア語	Arabic	ar
トルコ語	Turkish	tr
フランス語	French	fr
ドイツ語	German	de
ロシア語	Russian	ru
ポルトガル語	Portuguese	pt
スペイン語	Spanish	es
イタリア語	Italian	it
オランダ語	Dutch	nl
ポーランド語	Polish	pl
日本語	Japanese	ja
韓国語	Korean	ko
ウルドゥー語	Urdu	ur
ウイグル語	Uighur	ug
ベンガル語	Bengali	bn
ペルシャ語	Persian	fa
スウェーデン語	Swedish	sv
デンマーク語	Danish	da
ノルウェー語	Norwegian	no
アイスランド語	Icelandic	is
フィンランド語	Finnish	fi
ベラルーシ語	Belarusian	be
リトアニア語	Lithuanian	lt
チェコ語	Czech	cs
スロバキア語	Slovak	sk
ハンガリー語	Hungarian	hu
現代ギリシャ語	Modern Greek	el
ルーマニア語	Romanian	ro
アイルランド語	Irish	ga

国際化されたタグ

Text Moderation 2.0 多言語 PLUS サービスは、国際化されたタグシステムを使用します。コンテンツに複数のタイプのリスクが含まれている場合、複数のタグを同時に返すことができます。タグカテゴリには、以下が含まれますが、これらに限定されません:

ラベル	信頼度スコアの範囲	説明
pornographic_adult	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	ポルノコンテンツの疑い
sexual_terms	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	性的健康に関するコンテンツの疑い
sexual_suggestive	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	下品なコンテンツの疑い
sexual_orientation	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	性的指向に関するコンテンツの疑い
regional_cn	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	国内の政治的コンテンツの疑い
regional_illegal	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	違法な政治的コンテンツの疑い
regional_controversial	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	政治的な論争の疑い
regional_racism	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	人種差別の疑い
violent_extremist	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	過激派組織の疑い
violent_incidents	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	過激派コンテンツの疑い
violent_weapons	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	武器および弾薬の疑い
violence_unscList	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	国連安全保障理事会統合リスト
contraband_drug	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	薬物関連コンテンツの疑い
contraband_gambling	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	ギャンブル関連コンテンツの疑い
inappropriate_ethics	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	望ましくない価値観を持つコンテンツの疑い
inappropriate_profanity	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	虐待的または侮辱的なコンテンツの疑い
inappropriate_oral	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	下品な口頭コンテンツの疑い
inappropriate_religion	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	宗教的な冒涜の疑い
pt_to_contact	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	広告の連絡先情報の疑い
pt_to_sites	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	オフサイトトラフィック転送の疑い
customized	0 から 100。スコアが高いほど、信頼度レベルが高くなります。	カスタムキーワードライブラリにヒット

課金

Text Moderation 2.0 サービスは、従量課金の課金方法をサポートしています。

従量課金

Text Moderation 2.0 サービスを有効化すると、デフォルトの課金方法は従量課金になります。日単位で実際の使用量に基づいて課金されます。サービスを呼び出さない場合、課金されません。

モデレーションタイプ	サポートされるビジネスシナリオ (サービス)	単価
基本的なテキストモデレーション (text_standard)	国際ビジネス向けの多言語検出 (プロフェッショナル版): comment_multilingual_pro_global	1,000 コールあたり 0.3 米ドル

統合ガイド

ステップ 1: サービスを有効化する

サービスの有効化にアクセスして、Text Moderation 2.0 サービスを有効化します。

Text Moderation 2.0 サービスを有効化すると、デフォルトの課金方法は従量課金になります。日単位で実際の使用量に基づいて課金されます。サービスを呼び出さない場合、課金されません。API と統合すると、システムは使用量に基づいて自動的に請求書を生成します。詳細については、「課金」をご参照ください。

ステップ 2: RAM ユーザーに権限を付与する

SDK または API と統合する前に、RAM ユーザーに権限を付与する必要があります。Alibaba Cloud アカウントまたは RAM ユーザーの AccessKey ペアを作成できます。Alibaba Cloud API を呼び出す際には、AccessKey ペアを使用して ID 検証を完了する必要があります。AccessKey ペアの取得方法の詳細については、「AccessKey ペアの取得」をご参照ください。

手順

RAM 管理者として RAM コンソールにログインします。
RAM ユーザーを作成します。

詳細については、「RAM ユーザーの作成」をご参照ください。
RAM ユーザーに AliyunYundunGreenWebFullAccess システムポリシーを付与します。

詳細については、「RAM ユーザーに権限を付与する」をご参照ください。

上記の手順を完了すると、RAM ユーザーとして Content Moderation API を呼び出すことができます。

ステップ 3: SDK のインストールと統合

このサービスは、次のリージョンで利用できます。Text Moderation 2.0 サービスの SDK の詳細については、「統合ガイド」をご参照ください。

リージョン	パブリックエンドポイント	VPC エンドポイント
シンガポール	green-cip.ap-southeast-1.aliyuncs.com	green-cip-vpc.ap-southeast-1.aliyuncs.com
英国 (ロンドン)	https://green-cip.eu-west-1.aliyuncs.com	利用不可
米国 (バージニア)	https://green-cip.us-east-1.aliyuncs.com	https://green-cip-vpc.us-east-1.aliyuncs.com
米国 (シリコンバレー)	https://green-cip.us-west-1.aliyuncs.com	利用不可
ドイツ (フランクフルト)	green-cip.eu-central-1.aliyuncs.com	利用不可

説明

英国 (ロンドン) リージョンの設定は、シンガポールリージョンのコンソール設定を再利用します。米国 (シリコンバレー) およびドイツ (フランクフルト) リージョンの設定は、米国 (バージニア) リージョンのコンソール設定を再利用します。

API

使用上の注意

ビジネスインターフェイス: TextModerationPlus

この操作を呼び出して、テキストコンテンツモデレーションタスクを作成できます。HTTP リクエストの作成方法の詳細については、「リクエスト構造」をご参照ください。サンプル HTTP リクエストを使用することもできます。詳細については、「統合ガイド」をご参照ください。

課金情報:
これは課金対象の操作です。200 HTTP ステータスコードを返すリクエストに対してのみ課金されます。他のエラーコードを返すリクエストには課金されません。課金方法の詳細については、「課金」をご参照ください。

QPS 制限

この API の単一ユーザーに対する 1 秒あたりのクエリ数 (QPS) 制限は、1 秒あたり 100 コールです。この制限を超えると、API 呼び出しがスロットリングされ、ビジネスに影響を与える可能性があります。

リクエストパラメーター

名前	タイプ	必須	例	説明
[Service]	String	はい	comment_multilingual_pro_global	モデレーションサービスの種類。有効な値: comment_multilingual_pro_global: 国際ビジネス向けの多言語検出
[ServiceParameters]	JSONString	はい		モデレーションサービスで必要なパラメーターセット。JSON 文字列です。各文字列の詳細については、「ServiceParameters」をご参照ください。

表 1. ServiceParameters

名前

タイプ

必須

例

説明

[content]

String

はい

検出するコンテンツ

モデレートするテキストコンテンツ。テキストの長さは 600 文字を超えることはできません。

[dataId]

String

いいえ

text0424****

検出オブジェクトに対応するデータ ID。

大文字、小文字、数字、アンダースコア (_)、ハイフン (-)、ピリオド (.) で構成できます。ID は 64 文字を超えることはできず、ビジネスデータを一意に識別するために使用できます。

応答パラメーター

名前	タイプ	例	説明
コード	Integer	200	状態コード。詳細については、「コードの説明」をご参照ください。
[Data]	JSONObject		モデレーション結果のデータ。詳細については、「Data」をご参照ください。
[Message]	String	OK	リクエストに対する応答メッセージ。
[RequestId]	String	AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****	リクエスト ID。

表 2. Data

名前	タイプ	例	説明
Result	JSONArray		検出されたリスクラベルや信頼度スコアなどの結果。詳細については、「Result」をご参照ください。
DataId	String	text0424****	検出オブジェクトに対応するデータ ID。説明検出のためにリクエストパラメーターで dataId を渡すと、対応する dataId がここに返されます。
RiskLevel	String	high	設定された高リスクスコアと低リスクスコアに基づいて返されるリスクレベル。有効な値: high: 高リスク (カスタムキーワードライブラリにヒットした場合、リスクレベルはデフォルトで高になります。) medium: 中リスク low: 低リスク none: リスクは検出されませんでした説明高リスクのコンテンツは直接処理することをお勧めします。中リスクのコンテンツは手動でレビューすることをお勧めします。低リスクのコンテンツは、高い再現率要件がある場合にのみ処理することをお勧めします。その他の場合は、リスクが検出されなかったコンテンツと同じ方法で低リスクのコンテンツを処理することをお勧めします。リスクスコアは Content Moderation コンソールで設定できます。
TranslatedContent	String	翻訳されたテキスト	翻訳されたテキストコンテンツ。
DetectedLanguage	String	en	検出された言語。

表 3. 結果

名前	タイプ	例	説明
Label	String	political_xxx	テキストコンテンツがモデレートされた後に返されるラベルです。複数のラベルとスコアが検出される場合があります。サポートされているラベルの詳細については、「国際化タグ」セクションをご参照ください。
Confidence	Float	81.22	信頼度スコア。有効値は 0～100 で、小数点以下 2 桁まで有効です。一部のラベルには信頼度スコアがありません。
Riskwords	String	AA,BB,CC	検出された禁止用語です。複数の単語はコンマで区切られます。一部のラベルは禁止用語を返しません。
CustomizedHit	JSONArray	[{"LibName":"...","Keywords":"..."}]	カスタムライブラリにヒットした場合、Label は customized になり、カスタムライブラリの名前とカスタムワードが返されます。詳細については、「CustomizedHit」をご参照ください。
Description	String	ポルノコンテンツの疑い	Label フィールドの説明です。重要このフィールドは Label フィールドの説明です。変更または調整される場合があります。実際の処理結果については Label フィールドを処理し、結果の処理にこのフィールドを使用しないことを推奨します。

表 4. CustomizedHit

名前	タイプ	例	説明
ライブラリ名	String	カスタムライブラリ 1	カスタムライブラリの名前。
キーワード	文字列	カスタムワード 1,カスタムワード 2	カスタムワード。複数の単語はカンマで区切られます。

例

リクエスト例

{
    "Service": "comment_detection_pro_global",
    "ServiceParameters": {
        "content": "testing content",
        "dataId": "text0424****"
    }
}

レスポンスの例:

システムポリシーにヒット:

{
    "Code": 200,
    "Data": {
        "Result": [
            {
                "Label": "political_entity",
                "Description": "政治的なエンティティの疑い",
                "Confidence": 100.0,
                "RiskWords": "Word A,Word B,Word C"
            },
            {
                "Label": "political_figure",
                "Description": "政治家の疑い",
                "Confidence": 100.0,
                "RiskWords": "Word A,Word B,Word C"
            }
        ],
        "RiskLevel": "high",
        "DetectedLanguage": "en",
        "TranslatedContent": "翻訳されたテキストコンテンツ",
        "DataId": "text0424****"
    },
    "Message": "OK",
    "RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}

カスタムキーワードライブラリにヒット:

{
    "Code": 200,
    "Data": {
        "Result": [
            {
                "Description": "カスタムライブラリにヒット",
                "CustomizedHit": [
                    {
                        "LibName": "カスタムライブラリ名 1",
                        "KeyWords": "カスタムキーワード"
                    }
                ],
                "Confidence": 100,
                "Label": "customized"
            }
        ],
        "RiskLevel": "high",
        "DataId": "text0424****"
    },
    "Message": "OK",
    "RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}

コードの説明

コード	ステータスコード	説明
200	OK	リクエストは成功しました。
400	BAD_REQUEST	リクエストは無効です。これは、リクエストパラメーターが正しくないことが原因である可能性があります。リクエストパラメーターを注意深く確認してください。
407	NOT_SUPPORT	言語タイプを識別できないか、サポートされていません。
408	PERMISSION_DENY	これは、アカウントが承認されていない、支払い遅延がある、アクティベートされていない、または無効になっていることが原因である可能性があります。
500	GENERAL_ERROR	エラーが発生しました。これは一時的なサーバー側のエラーである可能性があります。リトライすることをお勧めします。このエラーコードが続く場合は、オンラインサポートからお問い合わせください。
581	TIMEOUT	タイムアウトが発生しました。リトライすることをお勧めします。このエラーコードが続く場合は、オンラインサポートからお問い合わせください。
588	EXCEED_QUOTA	リクエストの頻度がクォータを超えています。