Text Moderation 2.0 は、アップグレードされた多言語モデル機能を備えています。言語を自動的に識別し、より広範な言語をサポートします。国際的なビジネスシナリオに合わせたモデレーションポリシーとタグシステムを提供します。このトピックでは、Text Moderation 2.0 多言語サービスの特徴と使用方法について説明します。
特徴
Text Moderation 1.0 の多言語モデレーションサービスと比較して、Text Moderation 2.0 は、独立したポリシーとタグシステムを使用して、国際的なビジネス要件を満たします。また、ビジネス運用を簡素化し、手動レビューを支援するためのより多くの機能を提供します。
比較項目 | Text Moderation 2.0 | Text Moderation 1.0 |
多言語機能 | 38 言語をサポートします。 | 18 言語をサポートします。 |
モデレーション機能 | 複数のモデルを並行して使用します。ポリシーは、言語とリージョンの属性に基づいているため、より正確です。 | 単一のモデルを使用します。ポリシーは、言語属性に基づいて精度と再現率のバランスを取ります。 |
タグシステム | 国際化されたタグシステムを使用します。profanity や regional などの国際化されたタグを追加し、複数のリスクタグとサブタグをサポートします。 | 中国語のシナリオ用のタグシステムを使用し、単一のリスクタグのみをサポートします。 |
検出範囲 | コンソールですべての検出範囲を設定し、必要に応じて有効または無効にできます。設定は検出結果に直接マッピングされます。 | 一般的な検出範囲をサポートしますが、検出結果に直接マッピングされません。 |
API の特徴 | サービスが自動的に識別できるため、入力言語を指定する必要はありません。モデレーション後、サービスは言語タイプと翻訳された英語のコンテンツを返し、手動レビューを支援します。 | 入力言語を指定する必要があります。サービスは翻訳されたコンテンツを返しません。 |
サポートされる言語
Text Moderation 2.0 多言語サービスは 38 言語をサポートします。
言語タイプ | 英語名 | 言語コード |
英語 | English | en |
簡体字中国語 | Chinese | zh |
繁体字中国語 | Traditional Chinese | zh-tw |
インドネシア語 | Indonesian | id |
マレー語 | Malay | ms |
タイ語 | Thai | th |
ベトナム語 | Vietnamese | vi |
タガログ語 | Tagalog | tl |
ヒンディー語 | Hindi | hi |
アラビア語 | Arabic | ar |
トルコ語 | Turkish | tr |
フランス語 | French | fr |
ドイツ語 | German | de |
ロシア語 | Russian | ru |
ポルトガル語 | Portuguese | pt |
スペイン語 | Spanish | es |
イタリア語 | Italian | it |
オランダ語 | Dutch | nl |
ポーランド語 | Polish | pl |
日本語 | Japanese | ja |
韓国語 | Korean | ko |
ウルドゥー語 | Urdu | ur |
ウイグル語 | Uighur | ug |
ベンガル語 | Bengali | bn |
ペルシャ語 | Persian | fa |
スウェーデン語 | Swedish | sv |
デンマーク語 | Danish | da |
ノルウェー語 | Norwegian | no |
アイスランド語 | Icelandic | is |
フィンランド語 | Finnish | fi |
ベラルーシ語 | Belarusian | be |
リトアニア語 | Lithuanian | lt |
チェコ語 | Czech | cs |
スロバキア語 | Slovak | sk |
ハンガリー語 | Hungarian | hu |
現代ギリシャ語 | Modern Greek | el |
ルーマニア語 | Romanian | ro |
アイルランド語 | Irish | ga |
国際化されたタグ
Text Moderation 2.0 多言語 PLUS サービスは、国際化されたタグシステムを使用します。コンテンツに複数のタイプのリスクが含まれている場合、複数のタグを同時に返すことができます。タグカテゴリには、以下が含まれますが、これらに限定されません:
ラベル | 信頼度スコアの範囲 | 説明 |
pornographic_adult | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | ポルノコンテンツの疑い |
sexual_terms | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 性的健康に関するコンテンツの疑い |
sexual_suggestive | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 下品なコンテンツの疑い |
sexual_orientation | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 性的指向に関するコンテンツの疑い |
regional_cn | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 国内の政治的コンテンツの疑い |
regional_illegal | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 違法な政治的コンテンツの疑い |
regional_controversial | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 政治的な論争の疑い |
regional_racism | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 人種差別の疑い |
violent_extremist | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 過激派組織の疑い |
violent_incidents | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 過激派コンテンツの疑い |
violent_weapons | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 武器および弾薬の疑い |
violence_unscList | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 国連安全保障理事会統合リスト |
contraband_drug | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 薬物関連コンテンツの疑い |
contraband_gambling | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | ギャンブル関連コンテンツの疑い |
inappropriate_ethics | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 望ましくない価値観を持つコンテンツの疑い |
inappropriate_profanity | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 虐待的または侮辱的なコンテンツの疑い |
inappropriate_oral | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 下品な口頭コンテンツの疑い |
inappropriate_religion | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 宗教的な冒涜の疑い |
pt_to_contact | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | 広告の連絡先情報の疑い |
pt_to_sites | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | オフサイトトラフィック転送の疑い |
customized | 0 から 100。スコアが高いほど、信頼度レベルが高くなります。 | カスタムキーワードライブラリにヒット |
課金
Text Moderation 2.0 サービスは、従量課金の課金方法をサポートしています。
従量課金
Text Moderation 2.0 サービスを有効化すると、デフォルトの課金方法は従量課金になります。日単位で実際の使用量に基づいて課金されます。サービスを呼び出さない場合、課金されません。
モデレーションタイプ | サポートされるビジネスシナリオ (サービス) | 単価 |
基本的なテキストモデレーション (text_standard) | 国際ビジネス向けの多言語検出 (プロフェッショナル版): comment_multilingual_pro_global | 1,000 コールあたり 0.3 米ドル |
統合ガイド
ステップ 1: サービスを有効化する
サービスの有効化 にアクセスして、Text Moderation 2.0 サービスを有効化します。
Text Moderation 2.0 サービスを有効化すると、デフォルトの課金方法は従量課金になります。日単位で実際の使用量に基づいて課金されます。サービスを呼び出さない場合、課金されません。API と統合すると、システムは使用量に基づいて自動的に請求書を生成します。詳細については、「課金」をご参照ください。
ステップ 2: RAM ユーザーに権限を付与する
SDK または API と統合する前に、RAM ユーザーに権限を付与する必要があります。Alibaba Cloud アカウントまたは RAM ユーザーの AccessKey ペアを作成できます。Alibaba Cloud API を呼び出す際には、AccessKey ペアを使用して ID 検証を完了する必要があります。AccessKey ペアの取得方法の詳細については、「AccessKey ペアの取得」をご参照ください。
手順
RAM 管理者として RAM コンソール にログインします。
- RAM ユーザーを作成します。
詳細については、「RAM ユーザーの作成」をご参照ください。
- RAM ユーザーに
AliyunYundunGreenWebFullAccessシステムポリシーを付与します。詳細については、「RAM ユーザーに権限を付与する」をご参照ください。
上記の手順を完了すると、RAM ユーザーとして Content Moderation API を呼び出すことができます。
ステップ 3: SDK のインストールと統合
このサービスは、次のリージョンで利用できます。Text Moderation 2.0 サービスの SDK の詳細については、「統合ガイド」をご参照ください。
リージョン | パブリックエンドポイント | VPC エンドポイント |
シンガポール | green-cip.ap-southeast-1.aliyuncs.com | green-cip-vpc.ap-southeast-1.aliyuncs.com |
英国 (ロンドン) | https://green-cip.eu-west-1.aliyuncs.com | 利用不可 |
米国 (バージニア) | https://green-cip.us-east-1.aliyuncs.com | https://green-cip-vpc.us-east-1.aliyuncs.com |
米国 (シリコンバレー) | https://green-cip.us-west-1.aliyuncs.com | 利用不可 |
ドイツ (フランクフルト) | green-cip.eu-central-1.aliyuncs.com | 利用不可 |
英国 (ロンドン) リージョンの設定は、シンガポールリージョンのコンソール設定を再利用します。米国 (シリコンバレー) およびドイツ (フランクフルト) リージョンの設定は、米国 (バージニア) リージョンのコンソール設定を再利用します。
API
使用上の注意
ビジネスインターフェイス: TextModerationPlus
この操作を呼び出して、テキストコンテンツモデレーションタスクを作成できます。HTTP リクエストの作成方法の詳細については、「リクエスト構造」をご参照ください。サンプル HTTP リクエストを使用することもできます。詳細については、「統合ガイド」をご参照ください。
課金情報:
これは課金対象の操作です。200 HTTP ステータスコードを返すリクエストに対してのみ課金されます。他のエラーコードを返すリクエストには課金されません。課金方法の詳細については、「課金」をご参照ください。
QPS 制限
この API の単一ユーザーに対する 1 秒あたりのクエリ数 (QPS) 制限は、1 秒あたり 100 コールです。この制限を超えると、API 呼び出しがスロットリングされ、ビジネスに影響を与える可能性があります。
リクエストパラメーター
名前 | タイプ | 必須 | 例 | 説明 |
[Service] | String | はい | comment_multilingual_pro_global | モデレーションサービスの種類。有効な値: comment_multilingual_pro_global: 国際ビジネス向けの多言語検出 |
[ServiceParameters] | JSONString | はい | モデレーションサービスで必要なパラメーターセット。JSON 文字列です。各文字列の詳細については、「ServiceParameters」をご参照ください。 |
表 1. ServiceParameters
名前 | タイプ | 必須 | 例 | 説明 |
[content] | String | はい | 検出するコンテンツ | モデレートするテキストコンテンツ。テキストの長さは 600 文字を超えることはできません。 |
[dataId] | String | いいえ | text0424**** | 検出オブジェクトに対応するデータ ID。 大文字、小文字、数字、アンダースコア (_)、ハイフン (-)、ピリオド (.) で構成できます。ID は 64 文字を超えることはできず、ビジネスデータを一意に識別するために使用できます。 |
応答パラメーター
名前 | タイプ | 例 | 説明 |
コード | Integer | 200 | 状態コード。詳細については、「コードの説明」をご参照ください。 |
[Data] | JSONObject | モデレーション結果のデータ。詳細については、「Data」をご参照ください。 | |
[Message] | String | OK | リクエストに対する応答メッセージ。 |
[RequestId] | String | AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE**** | リクエスト ID。 |
表 2. Data
名前 | タイプ | 例 | 説明 |
Result | JSONArray | 検出されたリスクラベルや信頼度スコアなどの結果。詳細については、「Result」をご参照ください。 | |
DataId | String | text0424**** | 検出オブジェクトに対応するデータ ID。 説明 検出のためにリクエストパラメーターで dataId を渡すと、対応する dataId がここに返されます。 |
RiskLevel | String | high | 設定された高リスクスコアと低リスクスコアに基づいて返されるリスクレベル。有効な値:
説明 高リスクのコンテンツは直接処理することをお勧めします。中リスクのコンテンツは手動でレビューすることをお勧めします。低リスクのコンテンツは、高い再現率要件がある場合にのみ処理することをお勧めします。その他の場合は、リスクが検出されなかったコンテンツと同じ方法で低リスクのコンテンツを処理することをお勧めします。リスクスコアは Content Moderation コンソール で設定できます。 |
TranslatedContent | String | 翻訳されたテキスト | 翻訳されたテキストコンテンツ。 |
DetectedLanguage | String | en | 検出された言語。 |
表 3. 結果
名前 | タイプ | 例 | 説明 |
Label | String | political_xxx | テキストコンテンツがモデレートされた後に返されるラベルです。複数のラベルとスコアが検出される場合があります。サポートされているラベルの詳細については、「国際化タグ」セクションをご参照ください。 |
Confidence | Float | 81.22 | 信頼度スコア。有効値は 0~100 で、小数点以下 2 桁まで有効です。一部のラベルには信頼度スコアがありません。 |
Riskwords | String | AA,BB,CC | 検出された禁止用語です。複数の単語はコンマで区切られます。一部のラベルは禁止用語を返しません。 |
CustomizedHit | JSONArray | [{"LibName":"...","Keywords":"..."}] | カスタムライブラリにヒットした場合、Label は customized になり、カスタムライブラリの名前とカスタムワードが返されます。詳細については、「CustomizedHit」をご参照ください。 |
Description | String | ポルノコンテンツの疑い | Label フィールドの説明です。 重要 このフィールドは Label フィールドの説明です。変更または調整される場合があります。実際の処理結果については Label フィールドを処理し、結果の処理にこのフィールドを使用しないことを推奨します。 |
表 4. CustomizedHit
名前 | タイプ | 例 | 説明 |
ライブラリ名 | String | カスタムライブラリ 1 | カスタムライブラリの名前。 |
キーワード | 文字列 | カスタムワード 1,カスタムワード 2 | カスタムワード。複数の単語はカンマで区切られます。 |
例
リクエスト例
{
"Service": "comment_detection_pro_global",
"ServiceParameters": {
"content": "testing content",
"dataId": "text0424****"
}
}レスポンスの例:
システムポリシーにヒット:
{
"Code": 200,
"Data": {
"Result": [
{
"Label": "political_entity",
"Description": "政治的なエンティティの疑い",
"Confidence": 100.0,
"RiskWords": "Word A,Word B,Word C"
},
{
"Label": "political_figure",
"Description": "政治家の疑い",
"Confidence": 100.0,
"RiskWords": "Word A,Word B,Word C"
}
],
"RiskLevel": "high",
"DetectedLanguage": "en",
"TranslatedContent": "翻訳されたテキストコンテンツ",
"DataId": "text0424****"
},
"Message": "OK",
"RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}カスタムキーワードライブラリにヒット:
{
"Code": 200,
"Data": {
"Result": [
{
"Description": "カスタムライブラリにヒット",
"CustomizedHit": [
{
"LibName": "カスタムライブラリ名 1",
"KeyWords": "カスタムキーワード"
}
],
"Confidence": 100,
"Label": "customized"
}
],
"RiskLevel": "high",
"DataId": "text0424****"
},
"Message": "OK",
"RequestId": "AAAAAA-BBBB-CCCCC-DDDD-EEEEEEEE****"
}コードの説明
コード | ステータスコード | 説明 |
200 | OK | リクエストは成功しました。 |
400 | BAD_REQUEST | リクエストは無効です。これは、リクエストパラメーターが正しくないことが原因である可能性があります。リクエストパラメーターを注意深く確認してください。 |
407 | NOT_SUPPORT | 言語タイプを識別できないか、サポートされていません。 |
408 | PERMISSION_DENY | これは、アカウントが承認されていない、支払い遅延がある、アクティベートされていない、または無効になっていることが原因である可能性があります。 |
500 | GENERAL_ERROR | エラーが発生しました。これは一時的なサーバー側のエラーである可能性があります。リトライすることをお勧めします。このエラーコードが続く場合は、オンラインサポート からお問い合わせください。 |
581 | TIMEOUT | タイムアウトが発生しました。リトライすることをお勧めします。このエラーコードが続く場合は、オンラインサポート からお問い合わせください。 |
588 | EXCEED_QUOTA | リクエストの頻度がクォータを超えています。 |